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Introducción 


Murray Sidman es posiblemente, un nombre poco conocido en muchas facultades y departamentos 
de Psicología de España y América Latina. A mi juicio, este hecho sería suficiente para juzgar el nivel 
en que se halla nuestra investigación psicológica; este hecho es el que me ha impulsado a escribir 
unas breves líneas de presentación a un autor y un libro que, en estos momentos, no deberían de 
necesitar de presentación alguna. Tácticas de investigación científica se utiliza, desde hace más de 
una década, como obligada obra de consulta y referencia, en muchos laboratorios de psicología del 
mundo entero. 


Inscrita en la línea de limpia tradición científica de Claude Bernard, es posible que Tácticas de 
investigación científica pueda representar, en muchos aspectos, para la Psicología lo que en su día 
Introducción al estudio de la medicina experimental (1865) fue para la Medicina. De hecho el lector 
atento que tenga presentes ambas obras encontrará en ellas muchos más puntos de contacto que el 
siglo que las separan haría esperar. Y si nuestro lector posee algunos prejuicios su sorpresa será 
todavía mayor pues Murray Sidman, bostoniano de 49 años, discípulo de Keller y Schoenfeld, es un 
skinneriano convencido, cuyos trabajos de laboratorio poseen, desde un punto de vista temático, 
escasa relación con las investigaciones fisiológicas de Bernard. Y sin embargo, no podía ser de otro 
modo; sólo hay un método científico. En lugar de seguir el ejemplo de los que llaman ciencia a la 
Psicología pero cambian a su comodidad el contenido del término ciencia, Sidman —como Bernard— 
nos muestra que su materia de estudio puede ser una auténtica ciencia natural del mismo rango que 
la Física. 


Para podes disponer de algún indicador objetivo, siquiera sea limitado, de la importancia de la obra 
de Sidman, hemos analizado los diez primeros volúmenes del Journal of the Experimental Analysis 
of Behavior, revista que agrupa a los psicólogos que trabajan dentro del marco del Análisis 
Experimental de la Conducta En estos diez años, los artículos publicados incluyeron cerca de 1,800 
referencias bibliográficas distintas, la mayor parte de las cuales corresponde a artículos y sólo 132 de 
ellas a libros de autor (hemos excluido de esta cifra los libros, muy corrientes en Estados Unidos, en 
los que un editor agrupa trabajos de autores diversos, bajo su criterio personal. De estos 132 libros, los 
6 que reciben mayor número de citaciones son: 


1.- Schedules of reinforcement (1957), de C. B. Ferster y B. F. Skinner. 
2.- The behavior of organisms (1938), de B. F. Skinner. 

3.- Principles of psychology (1950), de B. F. Skinner. 

4.- Conditioned reflexes (1927), de l. P. Pavlov. 

5.- Science and human behavior (1953), de B. F. Skinner. 


6.- Tactics of scientific research (1960), de M. Sidman 


Durante este período (1958-1967), Sidman es, después de Ferster y Skinner, el autor cuyos trabajos 
de investigación obtienen mayor número de citaciones (unas 300), a mucha distancia de sus 
inmediatos seguidores. Últimamente, de los 116 artículos publicados por Journal of the Experimental 
Analysis of Behavior durante 1972, el 20% de ellos incluye referencias de uno o varios trabajos de 
Sidman. 


Tácticas de investigación científica enseña cómo hacer y cómo juzgar la investigación en psicología 
experimental, y constituye, probablemente, una de las críticas más radicales, caras y rigurosas que se 
han escrito hasta el momento sobre muchas técnicas y métodos usados, corrientemente, en el 
laboratorio, sin embargo, a pesar de que la obra está destinada especialmente al estudiante de 
psicología, mucho nos tememos que su lectura presentará problemas a buena parte de ellos, al 
menos en nuestras latitudes. Sidman utiliza, desde las primeras páginas, unos ejemplos y 
terminología que forman parte de un bagaje que muchos quizá no poseerán en el momento de 
emprender el apasionante camino en el que va a servirles de guía. 


Por esta razón y debido, asimismo, a que el libro puede ser usado con provecho por estudiantes y 
profesionales ajenos a la Psicología, me atrevo a sugerir la utilización de algunas ayudas que, en la 
actualidad, son asequibles al lector español y latinoamericano. La primera de ellas se encuentra en el 
mismo libro que nos ocupa: cuando el lector se enfrente con el primer problema del tipo que hemos 
señalado, puede acudir a la Nota Terminológica existente al final del libro, e incluso podría ser 
aconsejable que la leyera entera antes de empezarlo. No obstante, si ésta no fuera suficiente, le 
recomendaríamos efectuar un itinerario que se iniciaría en Cómo investigar en psicología, de A. J. 
Bachrach (Madrid: Morata), seguiría por los tres primeros capítulos de Ciencia y conducta humana, 
de B. F. Skinner (Barcelona: Fontanella), para terminar en Análisis de la conducta, de J. G. Holland y 
B. F. Skinner (México: Trillas). De todas formas, y ésta serpa para algunos una lección difícil de 
aprender, debe tener en cuenta que toda la riqueza que encierra el libro de Sidman posiblemente no la 
podrá conseguir nunca leyendo libros o a través de la reflexión sino investigando. 


RAMÓN BAYÉS 


Marzo 1973 


Prólogo 


A pesar de que este libro no es, en el sentido tradicional, un libro de texto, quiero brindarlo al 
estudiante, y, en particular, al estudiante de psicología experimental. En él he reunido algunos de 
los problemas metodológicos con que deberá enfrentarse al evaluar tanto los datos de otros 
experimentadores como los suyos propios, y es que, la evaluación de datos, será para él una 
preocupación constante a todo lo largo de su carrera. Continuamente se verá en la necesidad de 
valorar y corregir su propio nivel de suficiencia y aptitud, y, en la medida en que la ciencia es 
acumulativa e integradora, su habilidad en evaluar, y por consiguiente juzgar en su justo valor, los 
datos de otros investigadores, tendrá importantísimas consecuencias sobre la validez de su propia 
aportación. 


Los procedimientos empleados en evaluar datos experimentales no pueden describirse 
adecuadamente sino con referencia a casos concretos, e incluso a la historia de dichos casos, 
puesto que la evaluación de datos constituye un problema de corte empírico, no filosófico, y no 
puede separarse ni de los datos en sí de las técnicas que han hecho posible su obtención. Por lo 
tanto me he visto obligado en muchos casos a hacer exposiciones considerablemente detalladas 
de datos concretos, de procedimientos experimentales y de problemas técnicos de tipo general. 
Los ejemplos que he seleccionado provienen bien de mi propia experiencia, bien de campos afines 
a mi área de competencia, aunque espero que el lector no inferirá de ello que yo considere que 
sean éstas las únicas fuentes existentes o, ni tan sólo, las mejores. Separados de la experiencia 
real, los ejercicios de evaluación carecerían de su ingrediente más esencial. 


Durante los últimos treinta años, la psicología experimental ha desarrollado sus campos de 
estudio y sus necesidades técnicas a un nivel tal que le es imprescindible un alto grado de 
competencia metodológica por parte de quienes la practican. El tipo de problemas que expongo y 
analizo en este libro no pueden ser considerados por más tiempo de la exclusiva incumbencia del 
investigador avanzado. Si el estudiante que comienza ha de afrontar el desafío que su objeto de 
estudio le presenta, con el respeto que este desafío exige y merece a la vez, debe considerar los 
problemas avanzados de ayer como su lección de hoy. Lo que en un principio se hallaba más allá 
de sus fronteras le es básico ahora. 


El concepto de psicología experimental que he avanzado aquí no es ni revolucionario ni tan solo 
nuevo. Sin embargo, debo prevenir al estudiante que no espere encontrar un conjunto de normas 
sobre el procedimiento experimental, que pueda memorizar como si se tratara de un libro de 
texto clásico, dado que el ejercicio de la ciencia es un asunto altamente personal. Los 
experimentadores no siempre saben decirnos el cómo o el porqué de lo que hacen, y el hecho de 
que sus conclusiones sean con tanta frecuencia válidas continúa siendo un rompecabezas para 
muchos filósofos, lógicos y científicos que han dedicado gran parte de su tiempo y esfuerzo a este 
problema. No intento ser, pues, no un sistematizador ni tan sólo un clasificador de las normas de 
la práctica experimental, ni tampoco pretendo erigirme en el portavoz de ningún grupo unificado. 
Incluso aquellos que, con la mayor exactitud, hallen descritas aquí sus actividades, se sentirian 
incómodamente, constreñidos si tuvieran que actuar solamente del modo que he descrito en el 


libro. Ni la práctica de la experimentación ni su producto pueden confinarse a unas reglas 
especificas —consideración que presta una cierta nota de ironía a cualquier libro que trate de 
metodología experimental. 


Hay muchas personas que han contribuido a la producción de este libro. Mi deuda con B. F. 
Skinner saltará a la vista del lector, aunque me complace reconocerla expresamente aquí. Muchas 
partes del libro se deben indirectamente a mi fecunda asociación, tanto personal como 
profesional, con personas como charles B. Ferster, Joseph V. Brady, David McK. Rioch, Richard J. 
Herrnstein, Arthur J. Bachrach y Richard L. Sidman. Los dos últimos que he citado también 
contribuyeron notablemente con sus comentarios e indicaciones sobre las primeras versiones del 
manuscrito. Debo un especial agradecimiento a Martha Crossen, que lo corrigió y pulió con un 
grado de afecto y competencia tal, que sólo el autor, que vio el libro antes y después, puede 
apreciar. Asimismo agradezco profundamente a Lilian Howell y Katherine Moyes su dedicación y 
esfuerzo, que permitieron la producción de un manuscrito legible. 


Nadie, de los arriba mencionados, puede ser considerable responsable del contenido de este libro. 
Hay dos personas, sin embargo, de las cuales no puedo decir lo mismo. Fred S. Keller y William N. 
Schoenfeld, que fueron mis maestros en el mejor sentido de la palabra, son los responsables de 
cuanto he escrito aquí, incluso de la que estén en desacuerdo conmigo. Sólo me cabe esperar que 
aceptarán gustosos esta responsabilidad, puesto que es a ellos que dedico el libro. 


MURRAY SIDMAN 


Sección | 
Criterios de la evaluación 


Al evaluar los hallazgos experimentales deben tomarse en consideración tres cuestiones de sumo 
valor: a) la importancia científica de los datos; b) la fiabilidad de los mismos, y c) su generalidad. 
Estas nociones, aunque dependientes entre sí, serán tratadas aquí, por conveniencia, como si 
fueran separables. 


Por más especializadas que puedan parecer al profano, la mayor parte de las ciencias cubren 
amplios campos, siendo pocos los científicos que están familiarizados, incluso dentro de su área 
de investigación particular, con todas las facetas que presentan. La mayoría de nosotros 
carecemos del tiempo, la energía, o la amplitud intelectual necesarios para profundizar en todos 
nuestros intereses. Tendiendo presentes estas limitaciones, debemos reconocer que nuestros 
prejuicios particulares —por otra parte inevitables- determinan la distinta importancia que 
conferimos a los datos existentes. 


Es, pues, necesario ser precavido en usar la supuesta importancia de los datos como criterio para 
su evaluación. La ciencia, al igual que la moda, tiene sus caprichos y sus ciclos. Debido a ello, un 
descubrimiento que caiga fuera de la corriente de interés en boga puede ser infravalorado o 
incluso pasar desapercibido, para ser quiza redescubierto años más tarde. Por el contrario, es 
frecuente hallar experimentos a los que se atribuye un interés máximo, por el hecho de resolver 
un problema de actualidad, aunque tal vez de efímera importancia. Constituye una característica 
de la ciencia el que raramente podamos prever el curso de su futuro desarrollo. Muchos temas 
hoy apasionantes caerán mañana en el olvido a medida que la corriente del progreso científico se 
desvíe hacia nuevos cauces. 


Ello no significa, claro está, que los experimentos que se llevan a cabo hoy serán inútiles. En el 
mejor de los casos pueden determinar las nuevas direcciones a seguir; en el peor, pueden resultar 
estériles. Sin embargo, muchos cumplen con la función de desechar la hojarasca creada por 
pseudoproblemas, por controversias sin importancia y por falacias metodológicas que 
irremisiblemente acompañan a cualquier fase del avance científico. Nunca resulta fácil decidir si el 
entusiasmo o la apatía del momento son exponentes de un juicio maduro. El veredicto provendrá 
del desarrollo de la misma ciencia. 


I. La importancia científica de los datos experimentales 


Para evaluar la fiabilidad y generalidad de los datos, suele ser importante conocer los objetivos del 
experimentador. Sin embargo, al evaluar la importancia de los resultados experimentales, a 
menudo la ciencia hace caso omiso de los razonamientos del investigador y encuentra para los 
datos obtenidos un contexto más apropiado que el propuesto para él. Sea como fuere, los 
problemas empiezan a surgir cuando los científicos hacen juicios de valor acerca de las razones 
por las cuales efectúan experimentos, usando dichos juicios como criterio para aceptar o desechar 
datos. Los datos correctamente hallados son siempre separables, con respecto a su importancia 
científica, de los propósitos con los que fueron obtenidos. Hay muchas razones, todas ellas 
legítimas, para hacer experimentos, que han influido y continúan influyendo, a los 
experimentadores. 


¿POR QUÉ Y PARA QUÉ EXPERIMENTAR? 


Probablemente resulte imposible enumerar todos los propósitos con que se efectúan 
experimentos. Me limitaré, por lo tanto, a tratar tan sólo algunas de las razones más frecuentes. 
El orden en que > trato no implica prioridad alguna, ya que para cada investigador sus razones son 
siempre las más importantes. 


EXPERIMENTOS REALIZADOS PARA EVALUAR HIPÓTESIS 


Las filosofías de la ciencia que defienden la comprobación de hipótesis como un paso esencial en 
el proceder experimental han sido con frecuencia hábilmente expuestas, y no requieren aquí un 
trato más elaborado. En psicología, la escuela de experimentación que defiende la comprobación 
de hipótesis es, a no dudar, la actualmente dominante, y muchos de aquellos que organizan la 
investigación en este sentido han hecho importantes aportaciones. Sin embargo, quiero prevenir 
al estudiante para que no cometa el error de obcecarse con la idea de que toda experimentación 
debe derivarse de la comprobación de hipótesis, puesto que este enfoque puede indagar también 
una incapacidad para separar los datos del propósito con que los obtiene el que experimenta. El 
psicólogo, al igual que los demás científicos, debe reconocer que los avances en el conocimiento 
muy a menudo provienen de fuentes inesperadas. Un hombre puede tener una intuición sobre la 
naturaleza, y el que más tarde aquélla se vea confirmada o refutada, puede desde luego significa 
mucho. No obstante, tal como ha observado Skinner, “hay indudablemente mucha gente cuya 
curiosidad acerca de la naturaleza es mucho menor que la que sienten sobre la exactitud de sus 
conjeturas...” (81, página 44). Una actividad experimental de este tipo puede no conducir más allá 
de una acumulación de trivialidades. 


Las hipótesis pueden formularse a muchos niveles y, mientras que la psicología de la formulación 
de hipótesis no está muy avanzada, la filosofía de la elaboración de teorías es una disciplina muy 
trillada. Dado que la mayor parte de os estudiantes de psicología experimental cursarán muy 
probablemente alguna asignatura sobre esa especialidad, no voy a profundizar aquí en el tema. 
Citaré. Sin embargo, dos ejemplos extremos con objeto de clarificar algunos puntos referentes a 
la evaluación de datos. 


Para empezar, consideremos el tipo de hipótesis tan sumamente trivial que apenas puede recibir 
ese nombre. En cierta ocasión diseñé un procedimiento experimental para determinar si un 
estimulo al que seguía un shock inevitable alteraría la probabilidad de emisión de una conducta de 
evitación en curso. Se había entrenado a un mono para que apretara una palanca, y pospusiera así 
la administración de breves shocks eléctricos. Una vez que la conducta de apretar la palanca hubo 
alcanzado una frecuencia estable, se presentaba ocasionalmente un estímulo auditivo (en este 
caso u zumbido) de cinco minutos de duración, al término del cual se administraba al animal un 
shock eléctrico inevitable. (En otras palabras, el ambiente había sido cambiado: aunque el mono 
todavía podía evitar la mayor parte de los shocks apretando la palanca, había ahora periodos al 
término de los cuales su conducta de apretar la palanca no tenía ya el mismo efecto. Cada vez que 
el zumbido había sonado durante cinco minutos, el mono recibía un shock inevitable.) 


Uno de mis colegas me peguntó qué esperaba yo que sucediera a la conducta de evitación en 
curso como resultado de asocia el nuevo estímulo con el shock inevitable. Después de meditarlo 
brevemente, repliqué que no concebía que la conducta se mantuviera inalterada, pues la 
operación experimental introducida representaba un cambio radical en el ambiente del sujeto, y n 
es frecuente encontrar organismos que no respondan de algún modo a este tipo de 
manipulaciones. Tampoco podía concebir que la privacidad de la respuesta de evitación fuera a 
decrecer, ya que si una reacción de este tipo se produjera bajo análogas condiciones fuera del 
laboratorio, la especie no habría llegado a sobrevivir para servirme de sujeto en mis 
experimentos. Sólo quedaba, pues, otra posibilidad: la probabilidad de emisión de dicha conducta 
debería aumentar. 


La confirmación subsecuente de mi hipótesis no me proporcionó ninguna satisfacción; tampoco 
muchos psicólogos hubieran celebrado mi experimento como un triunfo teórico. El razonamiento 
seguido era a todas luces defectuoso. A pesar de que el ambiente del sujeto había sido 
radicalmente alterado, los efectos hubieran podido manifestarse al margen de las medidas 
empleadas. Por otra parte, tampoco es infrecuente en el laboratorio encontrar sujetos que se 
comporten de un modo que diste mucho de ser el más adecuado con vistas a la adaptación al 
ambiente. Y, finalmente, el efecto resultante no tenía por qué ser ni un incremento, ni un 
decremento de probabilidad, sino algún complejo proceso cíclico que incluyera ambas cosas. 


Afortunadamente, efectué el experimento sin compromiso alguno con aquella hipótesis, lo cual 
me permitió observar el fenómeno por sí mismo y eventualmente llegar a una explicación 
relativamente consistente de los hechos. No hay. Desde luego, nada intrínseco a la comprobación 
de hipótesis que impida observar y recopilar los datos a medida que van apareciendo. Pero 


cuando los razonamientos que encadenan la hipótesis con los datos es débil, continuar 
recopilando datos puede resultar totalmente inconsistente en relación con los hallazgos 
originales. 


Las hipótesis que en general comprueba el psicólogo no suelen ser tan ingenuas y simplistas 
como la que acabo de describir. Consisten en ocasiones en una elaborada serie de supuestos que 
tienen que ver a la vez con la conducta del organismo y con las técnicas empleadas para medirla. 
En algunos casos el argumento se reduce a una proposición matemática, y lo que motiva este 
modo de teorizar está al margen de toda crítica. Sin embargo, aquellos psicólogos que ponen en 
práctica su ciencia con este enfoque. Intentan situar la psicología al mismo nivel que otras ciencias 
teóricas altamente desarrolladas. Si ello es o no posible, o incluso razonable, no es de mi 
incumbencia en este momento, ya que de discutirlo nos alejaríamos excesivamente del tema que 
nos ocupa. 


Los experimentos que comprueban el grado de adecuación de modelos matemáticos así como 
otros tipos de teorías deductivas proporcionan, a menudo, un gran prestigio a su autor, y su 
importancia suele darse por sabida. Quiero señalar, de todos modos, que la importancia de los 
datos n se ve afectada por el grado de refinamiento de las hipótesis que puedan haber dado lugar 
a los experimentos. Con excepción de quienes definen la importancia de los datos en función de su 
posibilidad de integración a una teoría, muy pocos psicólogos negarían que los fenómenos 
conductuales más interesantes no han sido siquiera tocados por las teorías más rigurosas del 
momento. El investigador se halla, pues, frente a un dilema: ¿deberá seguir las directrices 
dictadas por los teóricos más prominente y diseñar experimentos cuyos daos sólo pueden ser de 
interés en función de la teoría en cuestión? O bien, por el contrario, ¿deberá efectuar 
experimentos que él crea que van a producir datos de interés general, al margen de si las teorías 
en boga pueden o no acogerlos? No es posible responder taxativamente a estas preguntas, pero 
el estudiante tiene que darse cuenta de que se le plantea un problema que deberá resolver por sl 
mismo, teniendo bien presente la evidencia científica de que los verdaderos datos son 
extraordinariamente volubles. Con ello quiero decir que tales datos pueden servir tanto a una 
teoría como a otra, y que incluso mantienen su importancia en su ausencia. 


EXPERIMENTOS EFECTUADOS PARA SATISFACER LA CURIOSIDAD DEL INVESTIGADOR 
ACERCA DE LA NATURALEZA. 


En uno u otro memento, todo el mundo se hace las preguntas "¿por qué? ¿cómo? ¿qué?” El niño 
quiere saber de dónde vienen los bebés, y los padres a su vez preguntan “¿por qué se comporta de 
este modo?” Samuel Johnson observó que la curiosidad es una características siempre presente 
en una mene despierta, u quizá podría también definirse al científico como una persona que se 
gana la vida al tiempo que satisface su curiosidad. 


¿Cuales son, pues, las consecuencias de someter la curiosidad a una disciplina científica? Existen 
diferencias entre la curiosidad cotidiana la científica. Así, si por ejemplo un niño repara en la gran 


cantidad de abejas que se congregan entre las rosas de su jardín, tal vez pregunte a su padre qué 
hacen allí tantas abejas. El padre le contestará probablemente: “Están recogiendo polen de las 
rosas para transformarlo en miel”. 

El niño no-científico se detendrá ahí, sin más, habiendo satisfecho su curiosidad, mientas que el 
que posea un potencial científico mayor continuará su interrogatorio: “¿Qué es el polen? ¿Cómo 
hacen la miel con él? ¿No hay polen en la hierba? ¿Por qué tienen polen las rosas?” Si el padre o ha 
agotado aún la paciencia, el científico en ciernes probablemente saldrá con una pregunta que 
colocará a su informador en una situación límite: “¿Cómo lo sabes?” Aquí es donde la curiosidad 
científica difiere de la curiosidad vulgar: la primera se preocupa por los métodos utilizados para 
hallar respuestas a las preguntas. La curiosidad científica o queda satisfecha con la mera 
observación de que siempre hay flores presentes cuando las abejas sean atraídas por 
determinados colores, o quizás sea la forma de los pétalos lo que realmente importa. También 
puede que el polen que se pega a las patas de insecto sea un hecho incidental en su búsqueda de 
alguna substancia que lo haga atractivo a los individuos de sexo opuesto. La única manera de 
averiguar cuál de entre todas las posibilidades resulta ser la verdadera es a través de una 
observación controlada y del experimento. 


Otra diferencia ente la curiosidad cotidiana y la científica reside en las consecuencias que tienen 
las respuestas a las pregunta iniciales. La curiosidad vulgar se verá satisfecha una vez que haya 
obtenido una respuesta directa a la primera pregunta formulada. Por el contrario, la curiosidad 
científica se caracteriza por una reacción en cadena, puesto que en vez de apaciguarla, la 
respuesta a una pregunta aún incita más a la curiosidad que la provocó. Se ha dicho también que 
un buen experimento plantea más preguntas de las que soluciona. Así, el experimentador que 
sienta verdadera curiosidad acerca de la naturaleza, no quedará satisfecho con demostrar 
simplemente que existe una relación entre las abejas, las flores y el polen, sino que continuará 
planteándose preguntas, tales como: ¿de qué modo se orientan las abejas hacia las flores y hallan 
el camino de regreso a sus colmenas? El polen de flores distintas ¿produce también distintos tipos 
de miel?¿Qué función cumple el polen en la propia flor? ¿Qué les ocurre a las abejas en invierno, 
cuando no hay flores? A medida que vaya contestando a estas preguntas, el investigador 
efectuará observaciones que pueden, a su vez, proporcionar información sobre la organización 
social de las colonias de abejas, su lenguaje, los ciclos de reproducción de las flores, y quizás 
también sobre problemas ecológicos más amplios que atañan a las interacciones entre los 
aparentemente inconexos mundo de las plantas, los insectos y los hombres. Al final de una vida 
de trabajo, puede que el científico se pare a considerar toda su carrera, no sólo con orgullo sino 
también con asombro al observar los resultados de inocentes indagaciones empezadas muchos 
años atrás. 


La curiosidad puede, desde luego, estar guiada por hipótesis y teorías, pero la historia de la 
ciencia revela que muchos descubrimientos importantes han resultado de un planteo tan simple 
como éste: "me pregunto qué sucederá si...” Un elevado número de experimentos de gran 
trascendencia han sido llevados a cabo sin que el experimentador tuviera la más ligera sospecha 
de lo que probablemente resultaría de ellos. Al comprobar una hipótesis en la cual cree, un 


científico solamente se sorprende si los datos que obtiene desmienten su suposición, o bien si, 
siendo hostil a la hipótesis, su experimento la confirma. Por el contrario, cuando un investigador 
no experimenta para comprobar ninguna hipótesis, su vida está llena de sorpresas. 


Debe hacerse aquí una distinción entre tener una hipótesis y realizar un experimento para 
comprobarla. Con frecuencia hacemos conjeturas acerca del resultado de nuestros experimentos, 
e incluso las hacen quienes se consideran empiristas a machamartillo. Pero también suele ocurrir 
que el experimento sea planeado y se empiece a efectuar antes de formular conjetura alguna, 
puesto que el experimento se lleva a cabo con fines muy distintos de comprobar una hipótesis; en 
este caso, tampoco se juzgarán sus resultados según su concordancia con las predicciones. 
Ello pone de relieve una importante propiedad que poseen los experimentos diseñados para 


po 


contestar al “me pregunto qué sucederá si...”. Tales experimentos, si cumplen adecuadamente 
con los criterios de fiabilidad y generalidad, nunca obtiene resultados negativos. Los resultados 
sólo pueden ser negativos si los referimos a una predicción, pero cuando simplemente se hace 
una pregunta a la naturaleza, la respuesta es siempre positiva. Incluso una manipulación 
experimental que no produzca ningún cambio en la variable dependiente puede proporcionarnos 


información útil y a menudo importante. 


La psicología científica se encuentra en un estadio de desarrollo tal, que los resultados 
experimentales negativos debería constituir la excepción más que la regla. La conducta, como 
objeto de estudio, resulta extremadamente compleja, habiéndose analizado hasta el momento 
sólo una pequeñísima parte de ella en el laboratorio. Las variables de as que es función la 
conducta apenas han comenzado a ser exploradas. Esforzarse e posibilitar una eventual 
interacción teórica de los fenómenos conductuales constituye un digno objetivo; no debe 
olvidase, sin embargo, que hasta el presente no existe ningún tipo de acuerdo sobre cuáles son los 
datos significativos que dicha teoría debería integrar. Una cosa sí es cierta: no todos los daos 
significativos han sido ya obtenidos en el laboratorio, quedando aún una inmensa gama de 
fenómenos conductuales por controlar, analizar y estudiar con detalle. Ouizá por ello resulte 
incongruente hablar de resultados negativos. 


Es debido a que la conducta constituye un campo tan amplio, que B. F. Skinner confirió tanto 
valor a los fallos de los aparatos usados en el laboratorio como fuente de nuevos 
descubrimientos.* Resulta posible que con un objeto de estudio tan complejo, tan sensible a los 
cambios ambientales y tan inexplorado, un aparato efectúe un experimento por su cuenta y 
riesgo. Por ejemplo, en mi propio laboratorio se estaba llevando a cabo un experimento sobre 
conducta de evitación en el cual un animal debía recibir sólo un 20 por ciento del total de shocks 
que le estaban destinados, si dejaba de emitir la respuesta de evitación a su debido tiempo. 
Una avería en un relé del circuito de programación automática alteró un día el procedimiento 
experimental de tal modo que el animal recibía un shock de cada cinco independientemente de si 
había emitido la respuesta de evitación o no. La avería fue descubierta cuando la tasa, 
normalmente estable, de respuestas a la palanca empezó a aumentar, y continuó acelerándose a 
lo largo de la sesión experimental. Resultaba tan inesperado este aumento en la tasa de 
respuestas de evitación como consecuencia de los shocks inevitables, que inmediatamente se 


puso en marcha un nuevo programa de investigación, con tantas posibilidades, que ha sido 
extremadamente fructífero durante tres años y todavía continúa. 


No obstante, es imprescindible la presencia de un experimentador para evaluar los resultados 
obtenidos gracias a la avería de un relé, del mismo modo que lo es cuando éste funciona a la 
perfección. Pero nada garantiza tampoco que un científico aprecie debidamente un 
descubrimiento accidental, pues a menos que la actitud del experimentador sea de extremado 
interés en todo lo que pueda surgir, es muy probable que un hallazgo de este tipo pase 
desapercibido. Si, después de haber programado los aparatos y diseñado el procedimiento 
experimental cuidadosamente para hallar la respuesta a un problema específico, el investigador 
obcecado por una hipótesis descubre en el transcurso de su investigación una avería en el equipo, 
es muy posible que considere su experimento como un fracaso. Tras derramar algunas lágrimas 
de frustración, es de esperar que acto seguido se suba las mangas para arreglar el desperfecto y 
empezar de nuevo, convencido de que la ciencia debe su progreso a mártires como él. Por el 
contrario, es mucho más probable que el investigador sencillamente curioso se entretenga en 
examinar los datos producidos por el fallo mecánico. Gracias al poco apego a sus propias 
conjeturas, quizás considere ese nuevo y casual experimento más interesante que el que ya había 
empezado y, sin lágrimas en los ojos, se lance por un nuevo camino. 


Tal vez en ello radique la gran virtud del enfoque experimental basado en la simple curiosidad. 
Aquellos que no tengan hipótesis preestablecidas o que no se aferren demasiado a ellas, son los 
destinados a descubrir nuevos fenómenos por casualidad. El estudiante no debe infravalorar el 
papel que juega el azar en el progreso científico; muchos descubrimientos importantes han sido 
efectuados en el curso de investigaciones diseñadas con otros propósitos. Walter Cannon, 
eminente y prolífico fisiólogo acuño la popular palabra "serendipity”*, para referirse a estos 
descubrimientos accidentales.” 


El estudiante puede sacar en este contexto alguna interesan lección de la historia entre bastidores 
de una serie de experimentos que se conoció en los laboratorios de Walter Reed con el nombre de 
“proyecto úlcera”. Todo empezó con una labor llevada a cabo por Joseph Brady en los 
laboratorios de investigación conductual y que incluía diversos experimentos a largo plazo en los 
que varios monos eran expuestos a una gran variedad de procedimientos de condicionamiento, 
entre los que figuraba un cierto número de programas de reforzamiento con comida, de evitación 
de shocks, de castigo y de estimulación intracraneal, así como varias combinaciones de todos 
ellos (**). Una fastidiosa característica de estos experimentos era el elevado índice de mortalidad 


* Neologismo intraducible al castellano. Significa “don de descubrir causalmente cosas agradables” (N. del T.) 
** No queriendo interrumpir el tema central, he introducido algunos términos técnicos en estos primeros 
capítulos sin una definición adecuada de los mismos. Aunque no creo que sea necesario definirlos con gran 
precisión para comprender los puntos más importantes aquí expuestos, algunos lectores pueden, con plena 
razón, encontrar desconcertante el sistema seguido. Debido a ello he preparado un apéndice terminológico 
(ver página 372), que puede ser leído independientemente del resto del libro. Debo prevenirles, sin 
embargo, que dicho apéndice no es un índice del contenido del libro, sino incluye definiciones en gran 
medida elementales, de algunos de los términos técnicos que me ha parecido conveniente usar. 


entre los sujetos, que los experimentadores hubieran continuado considerando simplemente 
como un mal inevitable, de no haber sido por una afortunada casualidad: la asignación de R. W. 
Porter a los laboratorios de Walter Reed durante su servicio militar obligatorio. Porter había 
investigado úlceras extensamente y, al tener noticia del gran número de muertos entre los sujetos 
de Brandy, pidió practicar la autopista de os próximos animales que murieran. Tal como lo cuenta 
el propio Brandy, “durante los meses siguientes, Porter aparecía ocasionalmente en mi oficina, 
mostrándome en sus manos enguantadas un pedazo de intestino de mono recién extirpado. 
En algún lugar del tejido aparecía invariablemente un nítido agujero redondo que, según me 
explicaba detalladamente Porter, era una ulcera perforada. '¡Qué mala pata!” murmuraba yo, 
mientras Porter salía de la habitación sin más comentarios. Con el tiempo, empecé a pensar que 
Porter transportaba algún mensaje en sus manos enguantadas. Al fin, todo me pareció evidente 
cuando me hizo la observación que de los varios cientos de monos que había tenido ocasión de 
examinar en el pasado, ninguno había mostrado jamás señales de desarrollar una ulcera en 
ambientes normales.” 


Debido a esta extraña coincidencia de un alto índice de mortalidad entre sus sujetos y la presencia 
casual de un patólogo interesado en úlceras, cambió el curso de la investigación de Brady. Pero 
tan solo había empezado lo que había de transformarse en una serie de afortunadas casualidades. 
La próxima fue la elección del procedimiento de evitación, como el más apropiado para ulterior 
investigación de entre todos aquellos a que los monos habían sido expuestos. Se montó, pues, un 
experimento en el que un mono debía apretar la palanca, para así evitar shocks durante periodos 
de seis horas, que se alternaban con otros de descanso de idéntica duración. La alternancia de 
ciclos de seis horas continuó día y noche sin interrupción, día tras día. Cuando finalmente los 
monos fueron sacrificados y se practicó su autopsia, aparecieron las úlceras. Por otra parte, los 
monos que integraban el grupo de control, que había recibido exactamente el mismo número de 
shocks con la sola diferencia de que no se les concedió oportunidad alguna de evitarlos, no 
presentaron ninguna patología desacostumbrada. 


El lector puede preguntarse qué criterio se siguió para seleccionar un plan de ciclos alternos de 
seis horas, tal como más tarde descubrieron los experimentadores quienes al intentar acelera el 
proceso alagando los periodos de evitación y acortando los de descanso no obtuvieron úlcera 
alguna, el programa de seis horas alternadas resultó ser prácticamente el óptimo para 
producirlas. Subsiguientes mediciones de secreción de ácidos en el estómago, efectuados por 
Edwin Polish a través de fístulas gástricas, detectaron poca o ninguna secreción durante los 
periodos de evitación de seis horas, pero se observó que al cabo de unas tres horas después de su 
terminación, empezaba una copiosa producción de ácido. Aquí se dio una nueva casualidad 
afortunada, que resultó del hecho de que los experimentos iniciales tuvieron que ser efectuados 
en el despacho del Dr. Porter, debido a limitaciones de espacio. Para que el Dr. Porter pudiera 
disponer de una calma relativa durante el tiempo que se encontrara allí, se programaron los ciclos 
de seis horas de duración, de modo que uno de los períodos de descanso correspondiera 
exactamente con su horario de trabajo. 


Cabe destaca en favor de los que participaron en el “proyecto úlcera”, que, al presentar el informe 
de la investigación, no cedieron a la tentación de forzar retrospectivamente el procedimiento 
seguido, dentro del triple molde de hipótesis, comprobación y confirmación de la misma. Y 
pudiera haberse hecho así con toda elegancia, usando los datos de Polish sobre secreción gástrica 
como hipótesis, las variaciones de periodicidad de los ciclos de evitación y descanso como 
comprobación, y la aparición de úlceras dentro del ciclo de seis horas alternantes como 
confirmación. Afortunadamente, nadie estaba especialmente interesado en encuadrar el 
procedimiento realmente seguido dentro de ningún marco predeterminado de metodología 
científica. Estos hechos, relatados con toda honestidad, pueden muy bien inspirar, sin embargo, 
tanto al estudiante como al filósofo de la ciencia.** 


Los teóricos de la ciencia tienden a menospreciar en ocasiones la importancia de experimentos 
llevados a cabo con el mero fin de satisfacer la curiosidad del investigador y creen justificar este 
enjuiciamiento arguyendo que los experimentos sin una orientación teórica definida, Únicamente 
conducen a una colección desordenada de hechos inconexos entre sí y no a un cuerpo de 
conocimientos sistemático del tipo que la ciencia persigue. Si ello fuera cierto, representaría sin 
duda una serie crítica, puesto que la ciencia no consiste en simples catálogos de hechos ni 
muestras de información inconexa. Las observaciones experimentales deben ser ordenadas de 
algún modo antes de poder decir que contribuyen a una ciencia de la conducta. 


Podemos preguntarnos entonces en qué consiste una disposición ordenada de los datos 
experimentales, y si la teoría constituye el único método para organizar datos. Las propias teorías 
están sujetas a criterios de inclusividad, consistencia, precisión, pertinencia, fertilidad y 
simplicidad, y se aceptan o rechazan según el tipo y número de fenómenos que abarcan, y 
también según su consistencia de formulación al aplicarse a distintos datos, la corrección de sus 
predicciones, la adecuada lógica de las relaciones entre proposiciones teóricas y datos, el número 
de nuevos e interesantes fenómenos hacia los que atraen la atención, y el número de supuestos 
que requieren en proporción a la cantidad de datos 


¿En qué posición dejo todo ello al experimentador, de quien se supone que debe coordinar los 
datos que obtenga con la teoría? También él se encara con la enorme complejidad de la conducta, 
pero, ¿es ello razón para que abandone sus intentos de control experimental y exploración 
sistemática de los fascinantes, aunque teóricamente inexplorados fenómenos conductuales que 
descubre en su laboratorio y observa en el mundo que le rodea? 


Un prominente teórico de la psicología me expuso en cierta ocasión la queja de que no había 
podido conseguir un determinado tipo de datos que se obtienen en experimentos de 
condicionamiento animal experimentales. Concretamente, le interesaba examinar un registro de 
tipo poligráfico de las respuestas de apretar la palanca producidas durante el periodo en que el 
sujeto aprendía por primera vez que por cada respuesta obtendría un gránulo de comida. Pero no 
quería que el registro estuviera “contaminado” por ningún procedimiento deliberado de 
modelamiento impuesto por el experimentador para acelerar el aprendizaje. Con objeto de 
elaborar su formulación teórica había pedido dicha información a varios investigadores, quienes le 


habían dado la callada por respuesta. Él atribuía esta maña disposición al prejuicio antiteórico de 
los experimentadores que utilizaban esta técnica de condicionamiento. Me vi obligado a 
explicarle que aquellos que usan la técnica en cuestión hacía tiempo que habían pasado al estudio 
de fenómenos más complejos e interesantes que los que a él le interesaban. El suyo era, 
simplemente, uno de tantos casos en que el teórico está muy atrasado respecto al 
experimentador, no existiendo tanto un prejuicio en contra de la teorización como en contra de 
dar marcha atrás al tren experimental. 


¿Qué otros tipos de sistematización pueden darse, una vez descartada la mera catalogación de 
datos? Existen dos grandes escuelas diametralmente opuestas en su modo de enfocar los 
métodos que consideran más eficaces para la integración de datos diversos. La diferencia entre 
ambas reside, no en la presencia o ausencia de teoría, sino en el modo en que ésta es tratada. 
En un caso, las teorías son formuladas de antemano y luego comprobadas deductivamente por 
medio de experimentos. En el otro, se experimenta primero, dejando que las teorías emerjan 
inductivamente a partir de los datos. 


Aquellos que abogan por el enfoque que coloca los datos antes que la teoría suelen argúir que los 
datos de que se dispone no son suficientemente completos como para que den lugar a una teoría 
que merezca la pena. Los que prefieren el enfoque opuesto, o sea, la teoría antes que los datos, 
replican: “¡Cómo saben si es o no posible formular una teoría adecuada si ni siquiera lo intentan?” 
La resolución de esta querella deberá surgir de una evaluación de las teorías actuales. Para ello, 
remito al estudiante a otras fuentes (por ejemplo, el número 28), puesto que mi labor se reduce 
por el momento a indicar qué técnicas pueden usarse para la sistematización de datos, incluso sin 
que se disponga todavía de una teoría coherente. Familiarizarse con tales técnicas conduce 
asimismo a solucionar el problema de cómo la curiosidad ateórica puede también ser selectiva 
con respecto a los experimentos específicos que deberán llevarse a cabo. 


En la práctica, existe un cierto número de técnicas para organizar datos al margen de cualquier 
marco teórico. Todos estos métodos poseen, sin embargo, un origen común. El investigador 
selecciona previamente un área de investigación y se dispone a explorarla concienzudamente. 
Muchos psicólogos experimentales, no obstante, están más acostumbrados a experimentar 
“a brincos”, saltando de una a otra área, descubriendo un hecho aquí, llevando a cabo un 
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experimento “crucial” allí, y “abriendo” un nuevo campo de investigación más allá. Pero ¿qué es lo 
que realmente constituye un área de investigación? Sólo los datos que obtengamos dentro de ella 
y el grado de sistematización posible nos pueden dar una respuesta. Es posible que el investigador 
encuentre que el área que ha definido es demasiado amplia y que debe restringir su campo de 
actividad si aspira a producir un cuerpo de datos sistemático. Por otra parte (y ésta es la 
posibilidad más interesante), puede que descubra que sus datos revelan interrelaciones con 


fenómenos que en un principio él había considerado muy alejados del área seleccionada. 


El estudio intensivo de un área de investigación llevado a cabo por un observador alerto, 
inevitablemente traerá a la luz un conjunto de interrelaciones entre los fenómenos comprendidos 
dentro de dicha área. Estas interrelaciones adoptarán la forma de similitudes entre las variables 


relevantes a los distintos fenómenos. Puede igualmente descubrirse que tipos aparentemente 
distintos de conducta sean el resultado de variaciones cuantitativas de un único factor 
determinante, o que en un complejo efecto conductual se produzca combinando adecuadamente 
dos o más procesos conductuales simples. A veces, Una serie de experimentos aparentemente 
irreconciliables hallarán una interpretación común al descubrirse un proceso conductual 
previamente irreconocido que es común a todos ellos y les sirve de nexo de unión. La forma de 
integración más elevada tiene lugar cuando se observan similitudes en las variables relevantes, 
entre experimentos propios en un campo restringido, y experimentos ajenos efectuados en un 
área de investigación aparentemente remota. 


La sistematización de datos a base de exponer las similitudes existentes entre sus variables 
determinantes puede parecer un empeño fastidioso al estudiante con ambiciones. Cuando yo 
mismo era todavía un estudiante postgraduado, tenía la sensación de que mi trabajo había de ser 
distinto, que tenía que producir algo nuevo que sorprendiera al mundo. Siguiendo esta línea, en 
una ocasión escribí un trabajo describiendo unas investigaciones en el que ponía de especial 
relieve lo diferentes que eran mis experimentos de todo lo que se había llevado a cabo 
anteriormente. Uno de mis profesores, W. N. Schoenfeld, admitió que los datos eran 
interesantes, pero también observó que había escrito el informe desde un punto de vista muy 
peculiar. yo había puesto énfasis en las diferencias entre mi labor y la de los demás, mientras que 
la ciencia es hallar relaciones ordenadas entre los fenómenos naturales, no diferencias, por lo que 
hubiera sido mucho más útil que hubiera resaltado las similitudes entre mi labor y otros 
experimentos previos. Aunque al principio encontré su consejo arduo de seguir, alcancé un nivel 
de madurez científica mucho más alto cuando finalmente logré ponerlo en práctica. 


La sistematización en términos variables comunes —identificación de similitudes—, constituye un 
prerrequisito vital para aquellos que se dedican a la búsqueda de una teoría de la conducta 
empíricamente sólida y racional. Ninguna teoría será nunca capaz de incluir todas las 
observaciones posibles. Tal como señalé anteriormente, los psicólogos no han podido ponerse de 
acuerdo todavía sobre los fenómenos menos conductuales que dicha teoría debería abarcar, 
incluso tratándose de una teoría restringida. Sólo el descubrimiento de variables y procesos que 
se manifiesten comunes a muchos fenómenos resolverá este problema. Para que tengan lugar 
tales descubrimientos tendremos que aumentar nuestro control experimental sobre el objeto de 
estudio, llevando a cabo un gran número de experimentos, sin otra hipótesis que la simple fe en 
que aparecerá el orden algún día. Es indudablemente temerario el científico que se atreve a 
predecir la forma que adoptará dicho orden o el que insiste en que otros hagan una tal predicción. 


EXPERIMENTOS EFECTUADOS PARA PONER A PRUEBA UN MÉTODO O TÉCNICA NUEVOS 


Es frecuente llevar a cabo experimentos con el fin de comprobar la eficacia y posibilidades de una 
técnica nueva. A veces, dicha técnica se desarrolla deliberadamente con el fin de obtener una 
determinada información que no podía conseguirse empleando los métodos normales. En otras 
ocasiones, la técnica se pone en práctica por mera curiosidad de conocer el tipo de datos a que 


dará lugar. A pesar de que todos los experimentadores consideren deseables los avances técnicos, 
surgen divergencias cuando se hacen juicios sobre qué constituye realmente un avance, de hecho, 
resulta a veces difícil, sino imposible, llegar siquiera a un acuerdo entre los psicólogos respecto a 
qué constituye una técnica. Puesto que la evaluación de la importancia de una técnica 
determinada sea reconocida por todos como tal, es pertinente plantearse esta pregunta: 
“¿Qué constituye una técnica en psicología experimental?” 


Tal como ocurre en otras ciencias, los avances técnicos en la psicología experimental pueden 
incluir mejoras en los instrumentos de medida, perfeccionamientos en los métodos de 
recopilación y análisis de datos, diseño de aparatos especializados para efectuar una tarea en 
particular, o de aparatos más generalizados con posibilidad de cumplir con un gran número de 
funciones, y también, extensión de técnicas antiguas a nuevos campos. Hay, sin embargo, un tipo 
de avance técnico que sólo es apropiado a la psicología experimental, consistente en desarrollar 
técnicas de control conductual. He señalado anteriormente que existe todavía un elevado número 
de fenómenos conductuales por controlar experimentalmente, pero es que, además, existen 
otros muchos fenómenos que, a pesar de que podemos estudiarlos en el laboratorio, sólo hemos 
logrado hacerlo, hasta ahora, en condiciones sumamente rudimentarias. Por ejemplo, cada vez 
que debemos emplear grupos de sujetos o amplias muestras conductuales de un solo individuo 
con objeto de pulir los datos, demostramos una carencia de control experimental sobre nuestra 
materia de estudio. Las mejoras técnicas que nos permitan traer nuevas conductas al laboratorio, 
o que nos faciliten un control experimental más refinado de la conducta, se sitúan entre las 
contribuciones más importantes que podemos realizar. 


Sin embargo, los psicólogos divergen en lo que se refiere a los fenómenos que consideran 
importantes, y, por lo tanto, su evaluación de una técnica de control estará teñida por la 
importancia que ellos atribuyan al fenómeno que ha pasado a ser mejor controlado. El estudiante 
deberá mostrarse cauteloso ante tales enjuiciamientos, puesto que técnicas al parecer inútiles, así 
como datos aparentemente esotéricos, pueden adquirir la máxima importancia del modo más 
imprevisible. 


Curiosamente, el desarrollo de las técnicas de control conductual rara vez es citado entre las 
metas más importantes de la investigación psicológica. A los estudiantes se les dice y repite que la 
investigación que llevan a cabo debe orientarse hacia el desarrollo teórico, o bien que lo que se 
necesita son más datos y más relaciones funcionales. Mientras tanto, las técnicas son relegadas a 
un lugar secundario respecto a esos objetivos, y, sin embargo, no son en absoluto secundarias, 
sino todo lo contrario: deben situarse antes que la teoría y los datos a la vez. Sin técnicas de 
control conductual, una ciencia de la conducta sería imposible. Aquellos que subrayan el carácter 
artificioso de las fronteras entre las diversas áreas de la ciencia, tienen razón, al menos 
parcialmente, cuando se refieren a la teoría y a los datos. Una ciencia no se diferencia de otra ni 
por la teoría ni por los datos. Son, por el contrario, las distintas técnicas de control experimental 
empleadas en cada campo de estudio las que proporcionan las características definidoras. 
Los fenómenos de interés científico sólo son accesibles a través de una gran variedad de 
aproximaciones técnicas, a pesar de que los datos así obtenidos puedan resultar más tarde 


sumamente fáciles de integrar, y la integración sea un camino que salte por encima del campo de 
la técnica. El psicólogo experimental puede contribuir a la mencionada integración de nuevo 
datos sólo en la medida en que descubra y aplique de control conductual, y es por ello que 
debemos considerar nuestra ciencia extraordinariamente enriquecida cada vez que alguien 
somete una nueva muestra de conducta a un control experimental riguroso. 


El no reconocer la importancia de tales evidencias se refleja en la exigua y superficial clasificación 
de técnicas de control conductual. Los métodos usados en el laboratorio para controlar la 
conducta no se suelen analizar más allá de una descripción del espacio experimental en que se 
coloca al sujeto para observación. Debido a ello, nos encontramos con descripciones de 
laberintos, corredores, cajas de Skinner, caja con trampillas, Wisconsin General Test Apparatus, 
etc., junto a las que se hace constar una breve mención de la respuesta seleccionada para su 
medición, y así, el estudiante se informa sobre las carreras que ejecutan las ratas, sus giros a 
derecha e izquierda, cómo saltan vallas o abren una trampilla. Naturalmente, tales datos tienen 
importancia, pero no en cuanto descripciones de los tipos de conducta sobre los que los 
psicólogos han obtenido control experimental. Propiamente, las técnicas de control conductual 
no se caracterizan en función del aparato utilizado, sino más bien según las variables que se han 
manipulado y las consecuencias conductuales que se derivan de esta manipulación. El grado de 
perfección de una técnica debe estipularse de acuerdo con la precisión y flexibilidad de control 
que se puede conseguir merced a ella. 


Es de interés general la metodología que Ferster y Skinner han desarrollado para estudiar el 
fenómeno del reforzamiento condicionado. Es éste un problema de capital importancia para 
psicología, puesto que el reforzamiento —el control de la conducta a través de sus consecuencias— 
suele considerarse una variable clave para determinar las características de la conducta. 
Sin embargo, es obvio que algunas consecuencias de la conducta que, ni forzando la imaginación, 
pueden considerarse como reforzadores “naturales” o “primarios” (por ejemplo el agua, la 
comida, el oxígeno, etc.), son las responsables de que mucha, si no la mayor parte de la conducta 
de los organismos superiores aparezca y se mantenga. Esta dificultad se ha confrontado con la 
noción de reforzamiento “condicionado”, según la cual se mantiene que los estímulos que de 
algún modo se asocian temporalmente con refuerzos primarios adquieren, a su vez, una función 
reforzadora. Así, un estímulo que preceda inmediatamente a la comida, decimos que adquiere el 
poder de controlar la conducta de un organismo hambriento, de un modo muy similar a como la 
propia comida lo hace. Desgraciadamente, la demostración experimental de este fenómeno ha 
distado mucho de ser satisfactoria hasta hace poco tiempo. Cuando se lograba conseguir el efecto 
deseado, éste era poco intenso y efímero. Han habido muchos fracasos al querer demostrar la 
existencia del reforzamiento condicionado, y allí donde ha sido posible hacerlo, se ha necesitado 
echar mano de técnicas estadísticas con objeto de obtener la significación deseada de los datos. 
Por el contrario, Ferster y Skinner han desarrollado varias técnicas a través de las cuales 
complejos patrones conductuales pueden generarse y mantenerse indefinidamente por medio del 
reforzamiento condicionado (34, pp. 658-702). Gracias a ello, este fenómeno resulta fiablemente 


demostrable en organismos individuales, habiéndose realizado con aplomas, ratas, monos y 
chimpancés. 


La técnica de estos autores no se reduce a la llamada caja de Skinner. El estudiante que para 
conocer dicha técnica se tenga por satisfecho con una especificación del tipo de recinto en que se 
coloca el sujeto, o de la forma que adopta la respuesta registrada, nunca aprenderá a controlar 
reforzadores condicionados con la precisión y rigor requeridos para sacar provecho de su estudio. 
Ferster y Skinner llegaron a desarrollar su técnica solamente después de un largo análisis 
experimental del encadenamiento y de los programas de reforzamiento. 


Cito a continuación un ejemplo relativamente sencillo. Una palma hambrienta puede conseguir 
un breve período de acceso a la comida picando sobre un pulsador, o disco, colocado en la pared 
de su espacio experimental. Sin embargo, sólo obtiene comida cada cincuenta picotazos sobre le 
disco, y siempre que el mismo se encuentre iluminado por la luz verde. En ocasiones, esta luz 
verde cambia a roja, pero al cabo de cinco minutos que el disco haya presentado este color, el 
primer picotazo de la paloma hará aparecer de nuevo la luz verde. Tenemos, pues, una secuencia 
de acontecimientos encadenados de este modo: la luz roja permanece encendida por lo menos 
cinco minutos, transcurridos los cuales, el primer picotazo sobre el disco hará cambiar la luz a 
verde. En presencia de este color, la paloma puede conseguir una pequeña cantidad de comida 
picando cincuenta veces sobre el disco. Después de recibida la comida, el disco se vuelve rojo y el 
ciclo empieza de nuevo. 


La luz verde es un reforzador condicionado; el hecho de que aparezca es responsable del picoteo 
de la paloma sobre el disco cuando su color es rojo. La luz verde adquiere su función reforzadora 
en virtud del reforzamiento primario —la comida-—, que sólo es accesible al animal en su presencia. 


Ferster y Skinner demostraron que un estímulo como la luz verde proyectada sobre el disco puede 
mantener su efectividad como reforzador condicionado indefinidamente, siempre y cuando le 
sujeto pueda producir el reforzamiento terminal, en este caso comida, según un programa 
apropiado. La eficacia del reforzador condicionado para mantener la conducta que le antecede es, 
en gran medida, función del programa bajo el cual se administra el reforzamiento terminal. 
El encadenamiento de respuestas y estímulos que eventualmente conducen al reforzamiento 
terminal es la clave de esta técnica. Los reforzamientos a que llegaron Ferster y Skinner mediante 
este procedimiento de encadenamiento, les permitieron replicar muchos de los efectos 
conseguidos con el reforzamiento primario utilizando el reforzamiento condicionado, así como 
desvelar variables relevantes a la conducta controladas por reforzadores condicionados. 
El estudiante que insista en que las técnicas deben especificarse con respecto a las variables 
manipuladas y la conducta observada, podrá, independientemente del tipo de aparato que utilice, 
colocar el reforzamiento condicionado bajo control experimental. 


Las técnicas de control conductual empleadas en el estudio del reforzamiento condicionado 
pueden ser utilizadas de muchas maneras, ya Sea para generar probabilidades de respuesta altas 
o bajas, patrones de respuesta cíclicos, respuestas aisladas o largas cadenas de conducta. 
Sin embargo, una técnica de control determinada resulta, en ocasiones, especialmente valiosa, 


debido a que genera un patrón de conducta específico. Puede ser interesante, por ejemplo, 
examinar detalladamente una conducta mientras está siendo emitida a una frecuencia 
extremadamente alta o extremadamente baja, puesto que resulta altamente plausible el hecho 
de que conductas que difieran ampliamente en su frecuencia de emisión, difieran también en 
otros aspectos, cualitativa, cuantitativamente o en ambos sentidos a la vez. Asi, se han 
desarrollado técnicas para mantener conductas a tasas superiores a 10,000 respuestas por hora 
durante muchas horas. Por otra parte, también es posible mantener estables tasas de respuestas 
muy bajas, con valores de una respuesta cada dos minutos, por un periodo de varias horas e 
incluso días. Tal grado de control experimenta constituye una técnica, ya que posibilita, en un 
organismo individual, el estudio experimental de fenómenos conductuales que nunca habían 
estado sujetos a un control de laboratorio. 


Además de su importancia en la demostración de principios conductuales, o en la tarea de 
generar y mantener determinados tipos de conducta, las técnicas de control también son valiosas 
en la producción de líneas de base conductuales con vistas a, estudio de fenómenos relacionados 
con la conducta. Por ejemplo, hay un interés ampliamente extendido en las relaciones existentes 
entre la conducta y la acción de agentes farmacológicos. Un aspecto importante de una droga 
determinada es su curso de acción temporal. Para ilustrar este caso, podemos establecer una 
línea de base de conducta de evitación utilizando como sujeto una rata blanca. Administramos al 
animal un breve shock eléctrico cada 20 segundos si no aprieta una palanca, y, cada vez que el 
animal la aprieta, pospone le shock durante 20 segundos. En estas circunstancias, una rata 
aprenderá a apretar la palanca, y lo hará a una tasa lo suficientemente alta como para evitar la 
mayor parte de los shocks. Después que el animal haya adquirido un poco de experiencia, 
alcanzará una tasa estable de respuestas a la palanca que suele permanecer constante durante 
períodos de seis horas o más. Una vez que la conducta de evitación haya alcanzado este nivel 
estable, podemos administrar una droga cualquiera al sujeto, pongamos por caso sulfato de 
anfetamina (conocido comúnmente con el nombre de Benzedrina) y el registro de la tasa de 
respuestas a la palanca del sujeto mostrará, a partir de este momento, una serie de variaciones 
con respecto a su trazado normal. Al poco tiempo de haber administrado el fármaco, la rata 
empezará a apretar la palanca con creciente velocidad, y el registro mostrará una aceleración 
uniforme a partir de su línea de base. La tasa así acelerada alcanzará un valor límite, tres a cuatro 
veces más alto de lo normal, permaneciendo a este nivel durante dos o tres horas. A partir de este 
momento empezará a decrecer, y el registro mostrará una desaceleración también uniforme 
hasta volver a la línea de base original. Sin embargo, el animal o no regresa simplemente a su tasa 
anterior de respuestas a la palanca, sino que continúa descendiendo por debajo de la línea de base 
y se mantiene a este nivel disminuido durante varias horas. 


Con objeto de poder estudiar las relaciones temporales entre droga y conducta, es necesario 
mantener la segunda a un nivel estable durante largos períodos de tiempo. Además, las 
mediciones realizadas para caracterizar la conducta, deben ser potencialmente variables en 
ambos sentidos. Es decir, para constituir un instrumento sensible en el estudio de la acción de una 
droga, dicha línea de base, utilizada como medida de referencia, además de permanecer estable a 


lo largo del tiempo, debe ser capaz de experimentar aumentos o disminuciones en una amplia 
gama. Una técnica de control conductual que cumpla con estos requisitos, permitirá el registro 
instantáneo y a la vez continuado del curso temporal de la acción de la droga. Además de ello, si 
paralelamente se van efectuando y registrando mediciones conductuales y fisiológicas de la 
actividad de la droga, puede resultar factible identificar aquellos efectos fisiológicos específicos 
que tienen una mayor probabilidad de estar relacionados con los efectos conductuales. El valor de 
tales técnicas de control, lo atestiguan el gran número de laboratorios de análisis experimental de 
la conducta que han sido instalados por las firmas de productos farmacéuticos. Este interés 
industrial por las técnicas conductuales no viene dado en absoluto por la caja de Skinner ni por la 
respuesta de apretar la palanca. Lo que ha impresionado, no ha sido el recinto experimental en sí, 
sino la precisión de control y la sensibilidad de la conducta individual a la manipulación 
farmacología, bajo la acción de muchas y muy diversas variables. Es evidente que cuando se trata 
de beneficios económicos, las técnicas de control conductual son juzgadas por su éxito en 
controlar variables y no por un esquema de clasificación anticuado, basado en los refinamientos 
de construcción de aparatos. Tal vez al científico “puro” le interese aprender esta lección. 


¿En qué consiste una técnica conductual nueva? Es posible inventar una técnica conductual 
aparentemente nueva que en realidad no constituya ningún avance respecto a los métodos viejos. 
Ello es especialmente cierto en lo que se refiere al diseño de nuevos aparatos. El editor de una 
revista especializada de psicología hizo una vez la observación de que su política era publicar 
artículos sobre técnicas nuevas, pero advirtió que nunca más publicaría la descripción de un nuevo 
taquistoscopio. Estoy seguro, sin embargo, de que acogería favorablemente la descripción de un 
método nuevo de utilizar dicho aparato. Uno de los criterios que caracterizan una técnica nueva 
es el que ésta sirva para obtener datos que no se hayan podido conseguir anteriormente. 
Estos nuevos datos puede proporcionarlos un taquistoscopio, un test proyectivo, un laberinto o 
una caja de Skinner, y si estos instrumentos se utilizan de un modo nuevo para obtener datos 
desconocidos hasta aquel momento, decimos que ha nacido una nueva técnica. A medida que el 
método en cuestión se vaya usando con creciente intensidad en el laboratorio, tal vez llegue a 
abrir nuevas áreas de investigación que no se hubieran concebido en sus aplicaciones iniciales. 


Por ejemplo, la combinación de métodos de programación de reforzamiento, con una adaptación 
de la técnica del audiómetro de Békésy, ha dado como resultado el desarrollo de una nueva área 
de investigación en psicofísica animal. En la técnica de Békésy? se enseña al sujeto a apretar una 
palanca mientras está oyendo un sonido determinado, y a dejar de apretarla cuando dicho sonido 
se hace inaudible. Un aparato atenuador que funciona continuamente, hace decrecer 
paulatinamente la intensidad del sonido mientras el sujeto está apretando la palanca. Cuando el 
sujeto deja de oírlo y suelta la palanca, el mecanismo invierte su dirección y aumenta la intensidad 
por encima del umbral. Mediante un registro de las variaciones de posición del aparato 
atenuador, a medida que fluctúa por encima y por debajo de la mínima intensidad audible, se 
obtiene una medición continuada del umbral auditivo del animal. 


La técnica de Békésy fue modificada por Blouhg, que la utilizó para medir los umbrales de 
intensidad visual en las palomas.? Éstas no pueden, lógicamente, recibir instrucciones verbales 


sobre lo que deben hacer, y Blough tuvo que emplear otras técnicas para colocar su conducta bajo 
el control de estímulos. Así pues, ideó una situación en la cual dos discos estaban al alcance del 
animal, y, usando técnicas de programación de reforzamiento adecuadas, entrenó a la paloma a 
picar sobre uno de los dos discos, siempre que viera un determinado estimulo luminoso, y sobre el 
otro cuando el estímulo en cuestión estuviera apagado. Los picotazos sobre el primer disco hacían 
disminuir la intensidad del estímulo, indicaba de modo continuado el umbral visual del sujeto a lo 
largo del tiempo. 


Tal como el mismo Blough señaló: “La novedad del método de Békésy reside en el modo en que 
las respuestas del sujeto hacen variar la intensidad del estímulo. Sin embargo, es igualmente 
importante el control ejercido en el sentido opuesto: la intensidad del estimulo controla a su vez 
las respuestas del sujeto” (9, pág. 31). La contribución de las técnicas de control conductual reside 
en el establecimiento de esta relación se "feed-back”. Si el estudiante se para a pensar en esta 
cuestión, se dará cuenta de que es un logro considerable el hecho de enseñar a una paloma a 
indicar el instante preciso en que deja de ver un punto luminoso, especialmente si se tiene en 
cuenta que su umbral va variando a medida que se adapta a la oscuridad, y que se pide al animal 
que vaya decidiendo continuamente cuál es este límite a lo largo de todo el experimento. Los 
detalles del procedimiento experimental de Blough son demasiado intrincados para ser descritos 
aquí, sin embargo encarezco al estudiante a que vaya a las fuentes y conozca la descripción 
completa de cómo se consiguió y se mantuvo este control de estimulo de un modo tan preciso. 
Fruto de la unión de dos conjuntos de técnicas al parecer inconexas, está surgiendo una nueva 
concepción del problema de la “sensación subjetiva”. 


Así, Una nueva técnica puede implicar el uso de aparatos nuevos o mejorados, o puede 
simplemente ser el resultado de nuevos usos o combinaciones de métodos antiguos. Al evaluar la 
importancia de una nueva técnica, el criterio de elección lo constituyen los datos que se obtienen 
con ella. 


EXPERIMENTOS EFECTUADOS CON EL FIN DE COMPROBAR LA EXISTENCIA DE UN 
FENÓMENO CONDUCTUAL 


La introducción de una nueva técnica de control puede tener como resultado la demostración de 
la existencia de un tipo de conducta que hasta aquel momento no se había observado, medido, o 
sometido a control experimental. Muy a menudo, sin embargo, los experimentos se llevan a cabo 
con el propósito especifico de demostrar un efecto conductual determinado. 


Los experimentos que simplemente demuestran la existencia de un nuevo fenómeno conductual, 
se desprecian en ocasiones, tachándolos de “exploratorios”. Se arguye que la ciencia avanza a 
base de manipular variables de un modo sistemático, y de unificar los resultados de esta 
manipulación dentro de un marco conceptual. La simple demostración de la existencia de un 
efecto conductual suele considerarse como el preludio a la investigación sistemática. Puede 
resultar descorazonador leer desde el principio al fin las publicaciones de algunos científicos que 


parecen haber consagrado su carrera a demostrar la existencia de nuevos fenómenos, sin 
profundizar nunca en ninguno de ellos a través de un estudio sistemático. Sin embargo, es una 
norma completamente equivocada permitir que nuestros sentimientos influyan en la evaluación 
de su importancia. Nuestro descorazonamiento morirá con nosotros, pero los hallazgos 
experimentales perdurarán. Si el descubridor de un nuevo fenómeno no profundiza en su estudio, 
alguien lo hará en su lugar, tan pronto como se reconozca la importancia del descubrimiento, 
aunque ciertamente es menos probable que su importancia se aprecie debidamente si el 
descubrimiento no se elabora experimentalmente de inmediato. Pero es precisamente este hecho 
el que nos debe impulsar a ser cautos antes de rechazar un nuevo fenómeno como trivial. 


En ocasiones, parece que los experimentadores brillantes y creadores no poseen las cualidades de 
paciencia y perseverancia que en general coincidimos en considerar vitales para el progreso 
científico. Mientras que, lógicamente, sería de desear que todos los investigadores fuesen a la vez 
creadores y perseverantes, tal combinación es, de hecho, rara. La mayoría de nosotros nos 
dedicamos a elaborar los descubrimientos de otros autores; pocos somos creadores, y sólo un 
reducido puñado puede considerarse ambas cosas a la vez. Sin embargo, todos somos necesarios, 
puesto que incluso el científico más creador, lleva a cabo su obra sobre unos fundamentos ya 
establecidos. Un menosprecio hacia el peso científico que ejecuta su tarea día tras día, puede 
impedir al estudiante darse cuenta de las aportaciones inmensamente valiosas y necesarias que 
sólo pueden provenir del duro y con frecuencia fastidioso trabajo de “pico y pala”. Por el contrario, 
y como a menudo ocurre, si se enseña al estudiante que el trabajo de “pico y pala” es Ciencia, 
irremisiblemente le pasarán desapercibidas las consecuencias de importantes descubrimientos 
sin elaborar. 


El descubrimiento de nuevos fenómenos es, ante todo, una empresa creadora (aunque aquí, el 
papel de la casualidad ni puede ignorarse, al igual que en otros tipos de experimentación). 
Algunas de las ciencias que han alcanzado un alto grado de desarrollo reconocen implícitamente 
este hecho, bautizando un nuevo fenómeno con el nombre de su descubridor. Pero rara vez se 
oye a los psicólogos referirse a un proceso conductual con el nombre del que lo descubrió. 
A muchos psicólogos experimentales parece preocuparles la obtención de datos, la elaboración 
de teorías, los métodos estadísticos y muchos otros problemas, algunos de interés y otros 
triviales, pero si un observador inteligente, ajeno a su objeto de estudio, repara en sus 
actividades, probablemente les pregunte, extrañado: “¿Dónde se halla el pensamiento? ¿En qué 
consisten la neurosis y la psicosis? ¿Acaso han olvidado que la conducta tiene lugar en una 
dimensión a la vez temporal y espacial? ¿Qué han descubierto sobre la conducta que obedece a 
causas múltiples? ¿Saben algo de la profunda apatía que mostraban los prisioneros de guerra 
americanos en los campos de concentración chinos?” Las preguntas podrían multiplicarse 
indefinidamente, y la pobre respuesta a la mayor parte de ellas es que no se han podido 
reproducir todavía los fenómenos necesarios, o sus equivalentes, en el laboratorio. No basta con 
excusarnos arguyendo que estamos intentando desarrollar una ciencia de la conducta, que una 
ciencia implica necesariamente mucha investigación que sólo es importante con respecto a su 
coherencia interna, y que debemos empezar con lo pequeño y lo simple al objeto de construir una 


base sólida para que la investigación más importante pueda llevarse a cabo más tarde. Tales 
argumentos son válidos, pero como respuestas a nuestro hipotético observador, su sinceridad es 
dudosa a menos que podamos demostrarle que poseemos una gran receptividad no es suficiente. 
Debemos buscar activamente nuevos procesos conductuales en el laboratorio, enseñando a 
nuestros alumnos en este sentido, y proporcionándoles recompensas profesionales apropiadas. 
Sólo entonces aceleraremos el proceso mediante el cual nuestra ciencia pueda enfrentarse con 
éxito a la conducta, tal y como tiene lugar en el mundo que nos rodea. 


¿Cómo se encuentran nuevos procesos conductuales que llevar al laboratorio? No hay fórmulas a 
aplicar. La fuente de nuevos fenómenos puede emerger de la propia experimentación 
sistemática, de la observación casual de conductas que acaecen fuera del laboratorio, de 
predicciones generadas por una teoría, o de problemas prácticos que se originan en áreas tales 
como la educación, el diseño de aparatos, la terapéutica o el control del tráfico. Los nuevos 
procesos que surgen de los datos experimentales poseen una ventaja sobre los que se derivan de 
otras fuentes: su inmediata disponibilidad para la manipulación experimental. Desde el momento 
en que los fenómenos han sido generados por procedimientos especificables, su elaboración en 
forma de investigación sistemática puede llevarse a cabo con un mínimo de ensayo -y-error. 


Cuando se intenta someter a control experimental un fenómeno conductual observado fuera del 
laboratorio, surge un difícil problema de inventiva, puesto que se han de hacer conjeturas sobre 
las variables relevantes al fenómeno en cuestión. ¿Son las variables interesadas similares a otras 
que ya han sido previamente estudiadas e el laboratorio? En caso contrario, ¿cómo podemos 
ingeniárnoslas para someterlas a control experimental? ¿En qué medida es susceptible de ser 
conceptualizada la conducta en cuestión? ¿Debemos, por ejemplo, duplicar con precisión la 
parálisis histérica de un paciente hospitalizado, o podemos tratar el mismo fenómeno en 
términos de la conducta de un mono al apretar una palanca? ¿Se han comprendido 
suficientemente los procesos conductuales, de modo que podamos reproducirlos en cualquier 
otra parte que no sea el lugar original? 


He hecho estas preguntas de un modo algo distinto al que normalmente se plantean. 
Un problema discutido con frecuencia en psicología, es si los datos obtenidos en el laboratorio 
pueden extrapolarse a la vida diaria. Sin embargo, lo que ahora nos concierne, es si la conducta 
cotidiana puede ser llevada al laboratorio. Esta pregunta nos acerca a un aspecto del problema de 
la generalidad de los datos experimentales, cuestión que trataré con cierto detenimiento en 
capitulos posteriores. Lo que me importa, en este momento, es cómo la respuesta a dicha 
pregunta afectará nuestros juicios sobre la importancia de los datos. 


Suele criticarse a los psicólogos porque sus experimentos están demasiado alejados de la vida real 
para proporcionar información útil sobre la conducta humana fuera del laboratorio. La conducta, 
al parecer, es una de las últimas materias de estudio aceptadas como ciencia experimental. 
Aunque todas las ciencias han sufrido objeciones similares en el pasado, nadie espera hoy en día 
que el físico estudie la gravedad observado la caída de las hojas de otoño, ni que el fisiólo go 
investigue sobre la velocidad de las transmisiones nerviosas a partir de los tiempos de reacción. 


Puede esperarse que también las leyes de la conducta resulten válidas dentro del laboratorio. 
Y, en la medida en que hay continuidad biológica desde los organismos inferiores a los superiores, 
podemos predecir sin gran riesgo que lo mismo sucederá a su conducta. 


Desgraciadamente, los mismos psicólogos están divididos en lo que respecta a esta cuestión. 
A algunos de ellos, simplemente no les preocupa si su trabajo es pertinente a la conducta 
humana. Puede que estén interesados en la conducta de los animales inferiores, o puede 
simplemente que les divierta distraerse un poco con cualquier conducta que les caiga en gracia. 
Sin embargo, no podemos poner auténticas objeciones a este enfoque, puesto que el 
conocimiento de la naturaleza sin otro propósito que la simple curiosidad es un empeño legítimo, 
y puede proporcionar grandes satisfacciones. 


Hay, de todos modos, algunos psicólogos que creen que la pertinencia a la conducta humana es 
un objetivo primordial de sus estudios experimentales, y sin embargo reivindican una pertinencia 
especial en un tipo determinado de experimentación, y lo contrario en otro. Así, tenemos al 
hombre que utiliza ratas blancas como sujetos experimentales, pregonando al mismo tiempo que 
el estudio de los parámetros es una pérdida de tiempo. Otro experimentador coloca al mono muy 
por encima de la rata, y lo defiende como máximamente representativo de la especia humana, 
negando taxativamente que exista ningún parecido entre su propia conducta y la de un roedor. 
Un tipo de psicólogo todavía más difícil de contentar, arguye que el estudiante de primer curso de 
universidad es el único que puede aportar datos de valor. A continuación, también encontramos 
que el estudiante ha sido descartado en favor del recluta militar sentado ante un panel de 
instrumentos. Finalmente, se suele oír que la única investigación realista sólo puede llevarse a 
cabo en un hospital mental. 


Tales puntos de vista no representan, en realidad, un grado de perfección mayor que los que 
defienden que todas las investigaciones llevadas a cabo en el laboratorio carecen de valor con 
vistas a una comprensión adecuada de la conducta humana. Tienen en común la noción 
equivocada de que debemos, de algún modo, apañárnoslas para realizar análogos experimentales 
de la conducta que observamos en nuestro prójimo. “Con objeto de estudiar la psicosis en los 
animales, debemos aprender a volverlos psicóticos”. Pero, ¿por qué razón debemos esperar que la 
psicosis de una rata tenga algún parecido con la de un ser humano? Mientras que un conjunto 
determinado de variables, actuando sobre un hombre puede conducirle a vivir en una caverna y 
comer estiércol, la misma clase de factores puede ocasionar que una rata continúe apretando una 
palanca a gran velocidad. Y durante mucho tiempo después de haberle retirado todo tipo de 
reforzamiento visible. Nuestro problema no es el de obtener análogos, sino llegar a comprender 
tanta las ratas como a los hombres, y ser capaces de reconocer paralelismos en los procesos 
conductuales. Debemos poder clasificar las variables que observemos de tal modo que seamos 
capaces de identificar similitudes en sus principios de operación, a pesar de que sus 
especificaciones físicas puedan ser muy diferentes. 


Supongamos que estamos interesados en el problema de la depresión humana que sigue a la 
muerte de un ser querido, y consideramos que la investigación de este fenómeno podría llevarse a 


cabo con éxito en el laboratorio, utilizando animales para ello. Nuestra tarea no consistirá 
simplemente en encontrar un mono que se deprima al morir su pareja. Más bien orientaremos 
nuestra acción a aplicar al mono aquellos principios conductuales que sospechamos que operan 
en la situación humana. Asimismo, tendremos que crear las condiciones apropiadas en el 
laboratorio de modo que podamos manipularlas y examinar sus aportaciones respectivas. Tal vez 
nuestro análisis preliminar del problema nos conduzca a suponer que el tipo de depresión 
conductual en cuestión resulta del hecho de retirar un poderoso reforzador generalizado. Quizá a 
continuación podamos, empleando todas las argucias técnicas a nuestra disposición, establecer 
un reforzador condicionado generalizado para nuestro mono experimental. Puede que incluso 
este reforzador generalizado sea otro mono. En este caso, el segundo mono estará asociado a 
tantos reforzamientos del sujeto experimental como sea posible, así como con un gran número de 
respuestas distintas. La asociación se habrá llevado a cabo de acuerdo con los principios de 
encadenamiento y reforzamiento condicionado que han resultado más eficaces en otros 
experimentos. Una vez establecida la relación deseada entre los dos monos, podemos retirar al 
segundo mono de la escena, despojando al primero de la fuente de muchos de sus reforzamiento. 
El paso siguiente podría consistir en observar todo cambio subsiguiente en la conducta del sujeto 
experimental, e incluso nos sería posible presentar un estímulo de advertencia para indicarle la 
retirada inminente del reforzador condicionado, y observar también la conducta de nuestro mono 
en presencia de este estímulo. 


¿Serán los cambios conductuales en el mono de laboratorio similares, en principio, al tipo de 
depresión humana por el que estamos interesados? Sabemos positivamente que estamos 
tratando con variables similares a las que actúan en el caso humano, y, aunque tal vez no 
podamos hacer un análisis exhaustivo, habremos dado un paso, como mínimo, hacia la 
identificación e investigación de los factores clave. Un experimento como éste, llevado a cabo con 
un mono, no garantiza por supuesto una menor comprensión de la conducta humana. Puede 
resultar que el mono no sea un organismo apropiado para este tipo de problema, o, incluso no 
siendo éste el caso, que nuestra forma técnica y sistemática de resolverlo no sea la apropiada para 
esta tarea particular. 


No obstante, hallamos un obstáculo todavía mayor para la extrapolación, en nuestra escasez de 
datos objetivos sobre el fenómeno humano. Mientras que la conducta del mono puede ser 
investigada a fondo y en toda su extensión, nuestro control y técnicas de observación para 
estudiar la vertiente humana del fenómeno, son, probablemente, mucho más incompletas. 
Sera difícil extrapolar los resultados obtenidos en el mono, puesto que el caso humano al que se 
debería hacer la extrapolación estará, en muchos casos, insuficientemente definido. A pesar de 
ello, la posibilidad de obtener la claridad de definición deseada es uno de los valores 
preeminentes de la investigación orientada a establecer fenómenos conductuales en el 
laboratorio. Es de esperar que, a través de la experimentación y de la acumulación de 
observaciones clínicas, aumentará nuestra comprensión de la conducta, hasta el punto de poder 
establecer una conexión con los descubrimientos realizados en el laboratorio. Todavía más, los 
datos experimentales pueden sugerir de hecho nuevos enfoques desde los cuales considerar la 


conducta humana, aunque en pocas ocasiones este tipo de sugerencias se reflejen en los propios 
datos. Como en cualquier acto de inducción, estas sugerencias serán producto de 
experimentación cuidadosa, imaginación creadora y un cúmulo de factores que requeriría un 
análisis más detenido de que es posible hacer aquí. Buscar análogos puede tal vez jugar algún 
papel en este proceso, pero ciertamente no es un componente necesario ni, en ocasiones, tan 
sólo deseable. 


A veces, cuando se demuestra en el laboratorio la existencia de un tipo de conducta comúnmente 
observado, oímos esta observación: “¿Y qué? ¡Todo el mundo sabe que la gente se comporta así! 
¿A quién le importa si las ratas o monos, o los estudiantes de primer curso también lo pueden 
hacer?” Una postura de este tipo admite de antemano que la observación común es un sustitutivo 
adecuado de la observación controlada. Puede que, en ocasiones, las dos coincidan, pero ello no 
se puede predecir sin antes efectuar estudios experimentales. La observación cotidiana de la 
conducta humana es notablemente incierta, dado que en nuestras impresiones e interpretaciones 
de la conducta, tal y como acontece a nuestro alrededor, tendremos a pasar por alto muchas de 
sus propiedades y de las variables que la determinan. En nuestras descripciones de la conducta, 
creemos ver muchas cosas que en realidad no existen, y damos por sentado, sin suficiente 
evidencia, que dos o más tipos de conducta son iguales simplemente porque lo parecen. El propio 
lenguaje que utilizamos en nuestras elucubraciones cotidianas sólo sirve a menudo para 
obscurecer los datos clave. Damos una “explicación” de la conducta empleando términos que se 
refieren a alguna condición hipotética del organismo. Tal como Skinner ha señalado: 


Un organismo posee un “hábito” en la medida en que se observa una forma de conducta 
determinada con una frecuencia especial —atribuible a hechos acaecidos en la historia del individuo-—. 
Asimismo se dice que posee un “instinto” en la medida en que también se observa un tipo de conducta 
determinada con especial frecuencia —en este caso, debido al hecho de pertenecer a una especie dada-. 
Una “actitud” expresa una frecuencia especial de un cierto número de formas de conducta. Estas 
frecuencias constituyen los hechos observables. Y pueden ser estudiadas como tales... (84, pág. 69). 


Debido a razones como las citadas, es poco frecuente que un estudio experimental proporcione 
una confirmación completa a nuestras impresiones cotidianas sobre la conducta. Estamos casi 
seguros de observar variables que no se delimitaron con suficiente precisión en las continuas 
fluctuaciones que presenta el mundo conductual ajeno al laboratorio, y de descubrir que factores 
al parecer importantes son irrelevantes, o, en el mejor caso, concomitantes innecesarios de la 
conducta en cuestión. 


Además de las ventajas de precisión manipulativa y analítica que muestra el control experimental 
de animales inferiores, también resulta Útil para estudiar fenómenos que nuestras tradiciones 
éticas y culturales nos impiden producir a nivel humano. Se reconoce, por ejemplo, que el castigo, 
tanto suave como severo, constituye una forma común de control conductual en casi todas las 
sociedades, incluyendo la nuestra propia. Sin embargo, no aceptamos este hecho hasta el 
extremo de admitir un castigo intenso en el laboratorio, excepto si se trata de sujetos no 
humanos. El castigo, así como varios tipos de fenómenos de stress, constituyen, por lo tanto, 
áreas clave en las que es de suma importancia ir consiguiendo un mayor control experimental 


sobre los fenómenos significativos, si queremos conseguir los beneficios de la investigación 
controlada en estas áreas, debemos dirigir toda nuestra inventiva hacia el problema de la 
reproducción de los procesos conductuales involucrados en el control aversivo. 


La inspiración que conduce al descubrimiento experimental de nuevos fenómenos conductuales 
no proviene necesariamente de modo directo de una preocupación por los problemas humanos 
tal como son percibidos en la vida diaria o en el diván del psicoanalista. Walter Hunter, por 
ejemplo, desarrolló deliberadamente su conocida técnica de respuesta retardada“ a partir de un 
deseo de investigar los procesos simbólicos. Sin embargo, otra técnica muy Útil de respuesta 
retardada que introdujo B. F. Skinner, se desarrolló simplemente como subproducto experimental 
(81, pp. 306-307). En sus estudios de los programas de reforzamiento de razón fija, en los que el 
sujeto debe responder un número determinado de veces por cada reforzamiento que recibe, 
Skinner llevó a cabo un experimento de control a fin de demostrar el papel jugado por la 
correlación entre reforzamiento y tasa de respuesta. Simplemente arregló las cosas de forma que 
una respuesta dada no fuera nunca reforzada si había sido precedida en menos de quince 
segundos por otra respuesta similar. La conducta generada por esta técnica (una baja tasa de 
respuestas temporalmente espaciadas) se ha convertido desde entonces en una de las líneas de 
base más interesantes y útiles para el psicólogo experimental. 


Un programa experimental consistente y bien integrado puede, por lo tanto, constituir una 
inagotable fuente de descubrimientos de nuevos fenómenos conductuales. Si el programa en 
cuestión es lo suficientemente intensivo, se llegará a un punto en que las viejas concepciones 
comenzarán a desmoronarse y serán necesarias nuevas técnicas para investigar variables que en 
un principio habían pasado desapercibidas. Siempre que se alcanza tal punto, se produce una 
crisis en el progreso experimental. Algunos investigadores no se dan cuenta de ello y continúan 
haciendo experimentos bajo las directrices que sentaron al principio de su programa, mientras 
que otros, aun reconociendo la crisis cuando se encuentran en ella, carece de la inspiración 
necesaria para aceptar el desafío y cambian de dirección, evitándola. Sin embargo, en algunas 
ocasiones, cuando un experimentador es capaz de crecer juntamente con sus datos, cuando está 
preparado para descartar o modificar drásticamente sus viejas técnicas y concepciones en favor 
de lo nuevo y lo no ortodoxo, la ciencia avanza a pasos de gigante. Una ciencia que no puede 
desvelar nuevos fenómenos que por medio de lo que podríamos llamar “la técnica de la 
investigación intensiva”, está en franco declive, y difícilmente puede decirse que la psicología se 
halle en esta situación. 


El impulso para emprender la demostración experimental de nuevos fenómenos conductuales 
puede venir aún de otra dirección. Los fenómenos conductuales no sólo interesan a los 
psicólogos, sino también a los fisiólogos, anatomistas funcionales, psiquiatras, sociólogos, 
antropólogos, ecólogos, farmacólogos, genetistas y a los representantes de otras disciplinas 
científicas. Entre otras disciplinas están, de todos modos, generalmente interesadas en la 
conducta como herramienta para la investigación de algo más, tal como el sistema nervioso, las 
drogas, la cultura, los movimientos de población o la herencia. Poseen ingeniosos métodos para 
investigar sus propios campos de interés, pero cuando desean relacionar sus observaciones con la 


conducta, suelen acudir al psicólogo para que les informe sobre las técnicas conductuales 
apropiadas. El psicólogo experimental debe estar en condiciones de afrontar estas demandas por 
parte de otros científicos, aunque ello suponga una complicación experimental suplementaria. 
Tal vez pueda hacer importantes aportaciones a áreas más amplias que el campo de competencia 
propio de la psicología o, todavía mejor, puede encontrarse con la oportunidad de someter a 
control experimental nuevos fenómenos conductuales. 


Muchos científicos que no están directamente interesados en los procesos conductuales en sí 
mismos son, sin embargo, agudos observadores de la conducta, además de que sus técnicas 
pueden producir o revelar cambios conductuales de inmenso interés para el psicólogo. 
En ocasiones, estos cambios son sutiles o difíciles de definir, y es de suma importancia poderlos 
colocar bajo un control experimental tan riguroso como sea posible. Permítaseme citar un 
ejemplo en el que, por desgracia, la psicología experimental no se ha distinguido por ninguna 
aportación apreciable. 


En cierta ocasión, fui presentado por un neurólogo a un paciente al que se había diagnosticado 
una psicosis de Korsakoff. Los síntomas que mostraba eran los clásicos de este sindrome. Cuando 
se le preguntaba dónde se hallaba (en un hospital), solía responder con el nombre de un hotel en 
el que se había alojado en el pasado. Cuando se le pedían datos acerca de su familia, respondía 
que carecía de ella o ben citaba el nombre de algún familiar muerto. Cuando el neurólogo le 
preguntaba su nombre (el del neurólogo), el paciente era incapaz de responder. El médico a 
continuación se lo decía, y le advertía que se lo volvería a preguntar al cabo de pocos minutos. 
Cuando volvía a pedírsele el nombre, el paciente respondía con otros, entre los que figuraban los 
de varios médicos del hospital que solían visitarle. Sin embargo, cuando estos médicos se 
encontraban presentes, el paciente tampoco decía sus nombres. Durante esta entrevista, el 
enfermo daba la impresión de esforzarse, y se le notaba turbado por sus propias respuestas. Podía 
también jugar a las damas, pero si tenía lugar alguna interrupción momentáneamente en medio 
de una partida, era incapaz de reanudar el juego. 


El neurólogo me planteó una pregunta simple: “¿Cómo debo clasificar el defecto conductual de 
este hombre?”, me preguntó, “¿Se trata de un fallo de memoria, de una desorientación temporal 
y geográfica, acaso de una falta de discriminación o de concentración? ¿Está mintiendo 
deliberadamente? ¿Le importa a él encontrarse así?” Yo no tenía, por supuesto, ninguna 
respuesta a mano. Sin embargo, lo que quiero señalar es el hecho de que el fenómeno estaba allí, 
esperando las técnicas del análisis de la conducta. El problema ni tan sólo requería que 
reprodujésemos el fenómeno en el laboratorio, puesto que el neurólogo había llevado a cabo una 
estupenda labor de observación con los medios de que suponía. Simplemente, estaba pidiendo al 
psicólogo que contribuyera, si podía, con un análisis más refinado de los procesos conductuales 
involucrados. Este análisis, de haber sido posible, habría permitido volver al laboratorio y 
construir un proceso conductual similar para ser estudiado con más detenimiento, dando lugar a 
un intercambio continuo entre el laboratorio y la clínica que hubiera contribuido al progreso de 
ambos. La psicología experimental apenas se encuentra en el umbral de este tipo de 
colaboración. 


EXPERIMENTOS EFECTUADOS PARA EXPLORAR LAS CONDICIONES BAJO LAS CUALES 
TIENE LUGAR UN FENÓMENO DADO 


Una vez que una nueva técnica o un nuevo fenómeno han sido introducidos en el laboratorio, se 
ha formulado una teoría o ha nacido la curiosidad a partir de unos datos, nuevas tareas esperan al 
investigador. Un nuevo hallazgo experimental o una teoría prometedora constituyen un desafío 
permanente mientras se encuentran aislados, sin posibilidad de relacionarlos con otros datos u 
otras teorías, respectivamente. El proceso de descubrimiento de las condiciones bajo las cuales 
tiene lugar un fenómeno dado, constituye el primer paso hacia la integración del mismo. 
La mayor parte de los datos que posee la ciencia son subproductos de este proceso, lo cual explica 
por qué muchos hallazgos experimentales tienen poco o ningún interés para el investigador no 
científico. El hombre de la calle suele preguntar: “¿Qué es lo que intenta usted demostrar?”, y 
cuando el investigador contesta, por ejemplo, que simplemente está tratando de averiguar si el 
reforzamiento primario y el condicionado obedecen las mismas leyes, su interlocutor puede 
sorprenderse de que un problema tan esotérico deba absorber tanta energía, tiempo y dinero. 
Un psiquiatra conocido mío tenía una respuesta preparada para esta pregunta: “masturbación 


| 


mental”, era su conclusión. 


Lo que no resulta tan evidente, incluso para el observador no científico, instruido y simpatizante, 
es que el científico, antes que nada, esté buscando un orden en la naturaleza. Sólo raramente un 
descubrimiento resulta útil, desde un punto de vista práctico, pero estos descubrimientos 
ocasionales suelen realzarse a partir de una sólida base de pequeños hallazgos, ninguno de ellos 
de gran trascendencia por sí mismos pero son los cuales nunca se hubiera podido dar el paso final. 
La ciencia confiere una importancia primordial a la solidez de los fundamentos del edificio; por 
ello muchos experimentos se llevan a cabo con el único propósito de establecer un sistema sólido 
y racional dentro de una particular área de interés. Nadie pretende que los experimentos 
efectuados a tal fin proporcionen, de inmediato, hallazgos y datos de utilidad práctica. A menudo, 
los datos se juzgan importantes en la medida en que establecen —o refutan— la solidez de otros 
datos, o de una conceptualización de los fenómenos naturales. Tales datos sirven para fortalecer 
la consistencia interna de la ciencia, y en este sentido, son fundamentales para el avance del 
conocimiento. Rara vez es posible predecir en qué “punto de esta cadena de evidencias los datos 
saldrán fuera del laboratorio al mundo exterior. 


En la búsqueda de las variables relevantes que controlan un determinado fenómeno conductual, 
hay varias consideraciones a hacer que influyen en las directrices de la experimentación. 
Es frecuente que el impetu inicial provenga de un deseo de alcanzar un mayor grado de 
refinamiento en el control experimental. Tal vez el experimentador confíe en la suerte al diseñar 
un experimento para producir un efecto conductual dado y, si las variables con las que 
acostumbra a operar son suficientemente poderosas, puede que su intento tenga éxito. 
Sin embargo, puede resultar una experiencia frustrante hallar, por ejemplo, que sólo un 
porcentaje determinado de sujetos experimentales producen el tipo de línea de base particular 
necesario para la buena marcha del experimento. 


En un caso como éste, y si está interesado en un control experimental más que estadístico, el 
investigador hará marca atrás y, abandonando temporalmente su eta inmediata, emprenderá la 
investigación de las variables que regulan las características de la línea de base en cuestión. 
Por ejemplo, tratará de encontrar una fórmula dietética que sea óptimamente eficaz como 
reforzador, es decir, que pueda mantener la conducta estabilizada durante un largo período de 
tiempo; o buscará las condiciones que mantengan una forma determinada de conducta en un 
nivel intermedio de modo que, al manipular las variables que le interesan, disponga de una 
medición más sensible, capaz de variar en sentido creciente y decreciente. Investigaciones de esta 
naturaleza pueden en ocasiones dar lugar a datos de más interés que el problema original, 
aunque, de cualquier modo, suelen cumplir en general con la función de establecer una 
metodología fiable que ayude a resolver problemas más generales. A pesar de que dicha función 
rara vez da lugar a experimentos espectaculares, no por ello debe menospreciarse. 


Estos experimentos, diseñados con el fin de hallar la combinación de variables óptima para ser 
usada con algún otro propósito, pueden ser tildados de “exploratorios” dado que no suelen 
llevarse a cabo por su interés intrínseco, y tal vez no cumplan con ninguna función adicional una 
vez obtenida la información necesaria. Pero incluso en este último caso, tales experimentos 
deben ponerse en conocimiento de los colegas, ya que a pesar de que los datos obtenidos tal vez 
no llenen ningún hueco en el contenido factual sistemático de la ciencia, proporcionan 
información metodológica vital. Por ejemplo, el tamaño óptimo del disco sobre el que deberá 
picar una paloma en un experimento, las condiciones de iluminación de un laberinto, o las 
instrucciones generales a seguir en un experimento psicológico cualquiera, presentan problemas 
de orden práctico que todo investigador que utilice los citados mecanismos deberá resolver. Si el 
problema ya ha sido previamente resuelto y sus soluciones se han colocado a disposición general, 
se ahorrará tiempo y esfuerzo en otros laboratorios. 


La experimentación encaminada a explorar las condiciones bajo las que un nuevo fenómeno tiene 
lugar, pueden tener implicaciones todavía más generales para la metodología. Puede estarse 
interesado, por ejemplo, en la conducta en estado estable, o sea, en una conducta cuyas 
características no cambian durante largos períodos de tiempo. Al mismo tiempo que se 
determinan las variables que mantienen un tipo de conducta dado en estado estable, tal vez se 
llegue a principios generales que puedan aplicarse también a otras conductas. 


La definición de un estado estable implica, normalmente, algún tipo de criterio. ¿Cuánto tiempo 
debe mantenerse la conducta y qué magnitud de variabilidad se le puede permitir para considerar 
satisfactorio el estado estable que se desea obtener? Este criterio puede ser determinado, según 
convenga, bien por un examen visual de las curvas, bien por complicados análisis matemáticos, de 
acuerdo con la precisión requerida por el problema que nos ocupe (ver Capítulo 9). Mientras se 
determina el grado de adecuación de un criterio, tal vez se efectúen observaciones cuya 
importancia trascienda el problema inmediato. Si éste es el caso, deberá reconocerse la 
importancia de dichas observaciones y hacerlas públicas para uso general de la ciencia. 
Por ejemplo, el programa de reforzamiento de intervalo variable, en el cual los reforzamientos se 
distribuyen en el tiempo de modo irregular, se ha convertido en una técnica relativamente usual 


para establecer un nivel estable de conducta de base tanto en los experimentos efectuados con 
animales como en los efectuados con seres humanos. Este programa tiene la virtud de generar 
una tasa de respuestas estable, característica para cada sujeto experimental dado, durante largos 
períodos de tiempo. Sin embargo, entre los que utilizan esta técnica, pocos investigadores 
conocen el hecho de que la conducta bajo el control de programas de reforzamiento de intervalo 
variable a menudo presenta fluctuaciones cíclicas a largo plazo. La conducta puede mostrar 
regularidad durante el período que ocupan la mayor parte de experimentos, pero las 
investigaciones de larga duración requerirán un estudio más intenso de este fenómeno cíclico, no 
sólo a fin de obtener datos de importancia tecnológica inmediata, sino también con vistas a la 
información sistemática básica, de interés para el problema más general y grave que es la 
conducta en estado estable. 


Otro tipo de problema que aparece con frecuencia lo constituye la reversibilidad de un proceso 
conductual (Capitulo 8). Después de observar un cambio conductual como consecuencia de 
alguna manipulación experimental, ¿es posible recuperar la conducta de línea de base original? 
La irreversibilidad constituye un fenómeno conductual de capital importancia, planteándose la 
incógnita de qué variables actúan en los casos en que tiene lugar. En cualquiera de ellos, la 
solución a este problema tendrá, además de su importancia respecto a la sistematización, un 
efecto sobre la metodología experimental utilizada en el estudio de la conducta. Si se puede 
manipular experimentalmente la conducta de un organismo, primero en una dirección y después 
en otra, con la posibilidad de volver siempre a su estado original, podremos soslayar gran parte de 
la variabilidad entre sujetos de que está plagada la psicología experimental (siempre y cuando no 
sea la variabilidad misma el objeto de estudio). 


Estos ejemplos constituyen sólo una porción negligible de los problemas metodológicos que 
requieren una exploración de posibles variables relevantes, y constituyen tan sólo una pequeña 
muestra de los problemas generales que actualmente son de interés. No se puede prever, en este 
momento, de qué naturaleza serán los requerimientos de las metodologías del futuro, pero si 
bien, por una parte, la historia nos enseña que no podemos predecir con exactitud las directrices 
de la investigación futura a largo plazo, también nos indica que las semillas de los avances 
venderos se están sembrando ahora. Por esta razón, no podemos permitirnos el lujo de pasar por 
alto ninguna demostración de una variable relevante. Incluso si una variable tal parece tener 
escasa importancia sistemática o metodológica en la actualidad, no deja de ser, a pesar de todo, 
un hecho conductual que, como tal, es importante. 


Mediante un análisis profundo de las condiciones bajo las que un fenómeno dado tiene lugar, a 
menudo se obtiene algo más que una demostración de la consistencia interna en un área 
determinada. La evaluación cuantitativa de las variables relevantes tal vez establezca relaciones 
entre fenómenos inconexos hasta el momento, debido al descubrimiento de variables comunes a 
los fenómenos en cuestión. La sistematización, a pesar de todo, no requiere necesariamente que 
un gran número de observaciones se incluyan dentro de un único conjunto de principios, a pesar 
de que una unificación de este tipo sea la forma de sistematización más perfecta. Existen muchos 
fenómenos que no tienen nada en común y, sin embargo, están relacionados. La sistematización 


tiene lugar no sólo cuando un fenómeno "engulle” a otro, sino cuando se descubre que dos o más 
fenómenos tienen, en algunos aspectos, una frontera común. Tampoco la integración sistemática 
de dos hallazgos experimentales requiere que uno de ellos pueda deducirse del otro. Cuando es 
posible llevar a cabo una deducción de este tipo sin necesidad de supuestos adicionales, no 
estamos tratando con dos fenómenos sino con uno solo. El hecho de que una deducción sea 
posible implica que la formulación del fenómeno A en realidad incluye el fenómeno B, sólo que las 
complejidades de tal formulación requieren un análisis lógico para revelar su contenido. 


Los datos pueden integrarse de otra manera, sin necesidad de un proceso deductivo. Dos 
conjuntos de fenómenos pueden no tener ninguna relación entre sí, excepto para un valor dado 
de una variable común a ambos, en cuyo caso los dos fenómenos se fusionan en uno solo. 
Tomemos, por ejemplo, el análisis de programas de reforzamiento realizado por Schoenfeld, 
Cumming y Hearst, a pesar de que su adecuación no ha sido todavía firmemente establecida. * 
En este análisis, no se hace ningún intento de deducir las consecuencias conductuales de un 
programa de reforzamiento dado a partir de las de otro programa distinto. En vez de ello, estos 
autores intentan demostrar que en los valores límite de ciertas variables empíricas la conducta 
generada por varios programas distintos es idéntica, sin importar el hecho de que, en otros 
valores cuantitativos de las variables críticas los programas den lugar a esquemas conductuales 
marcadamente distintos. Tampoco presenta ningún problema el hecho de que, a medida que las 
variables críticas se apartan cada vez más de sus valores límite, las conductas por cada programa 
en particular muestren efectos distintos al ser expuestas a manipulaciones experimentales 
parecidas. Ello se debe a que sistematización no es necesariamente sinónimo de reducción, y lo 
que ocurre es, simplemente, que ciertos fenómenos no son deducibles unos de otros. Así pues, la 
demostración de que dos o más fenómenos coinciden en un punto y a continuación divergen 
sistemáticamente constituye un logro de gran importancia con vistas a la integración. 
Esta técnica de integrar datos experimentales puede denominarse “método de contigUidad 
cuantitativa”. 


Existe una segunda técnica de sistematización a la que puede aplicarse el término de “método de 


contigUidad funcional”, por medio de la cual puede ser establecida una contigUidad —en forma de 
similitudes funcionales— entre dos fenómenos a pesar de que las variables cruciales difieran 


cuantitativa y cualitativamente en los dos casos. 


Por ejemplo, tomemos una situación experimental en la que un animal es reforzado con comida si 
emite una respuesta dada -pongamos por caso, apretar una palanca—. Sin embargo, en presencia 
de un estimulo dado, como el sonido de un zumbador, nunca recibe reforzamiento alimenticio. 
En este caso, podemos encontrarnos con que el estimulo en cuestión tanto pueda servir para 
aumentar, como para disminuir, la probabilidad de la respuesta que lo precedió. El que actúe 
positivamente o negativamente viene determinado por la duración relativa de dos intervalos de 
tiempo críticos: uno, la duración del propio estimulo; otro, el intervalo medio entre 
reforzamientos alimenticios que el animal recibe en su ausencia.** Designemos a este fenómeno 
con la letra A. 


El fenómeno B se produce en un experimento de evitación de shocks en el cual el sujeto recibe 
una descarga eléctrica sólo en presencia de un estimulo dado. De nuevo, este estimulo puede, o 
bien aumentar la probabilidad de una respuesta que lo precede, o bien disminuirla, de modo que 
su acción positiva o negativa viene dada también por la duración relativa de dos intervalos de 
tiempo críticos. En este caso, el primer intervalo a considerar es el período durante el cual, cada 
respuesta de evitación, emitida en presencia del estímulo, pospone el shock. El segundo lo 
constituye el periodo durante el cual cada respuesta de evitación emitida en ausencia del estimulo 
pospone la presentación del mismo.” 


Las variables críticas involucradas en los dos experimentos son marcadamente distintas. En el 
fenómeno A tratamos con programas que determinan con qué frecuencia una respuesta puede 
producir reforzamiento con comida. Por otra parte, en el fenómeno B, tratamos con programas 
que determinan la longitud del intervalo de tiempo que una respuesta puede posponer un shock. 
Pero en ambos casos, la variable de control debe especificarse como una relación entre dos 
intervalos de tiempo. La función del estimulo sólo puede explicarse tomando en consideración 
tanto el programa que opera en presencia del estimulo, como el programa que actúa en su 
ausencia. Así, a pesar de que las variables eran cuantitativa y cualitativamente distintas, el análisis 
funcional reveló que existía un proceso de relación en dos casos, cada uno de los cuales tenía que 
ver con fenómenos bastante diferenciados. 


Tanto el método de contigúidad cuantitativa como el de contigUidad funcional dependen, para 
resultar eficaces, de la selección apropiada de las variables dependientes e independientes. 
Los fenómenos conductuales pueden ser examinados desde numerosos puntos de vista, cada uno 
de los cuales pondrá un énfasis especial en variables distintas. Sin embargo, la primera condición 
para que se pueda llevar a cabo una sistematización adecuada consiste en la exigencia de que 
seleccionemos, como variable dependiente, algún aspecto de la conducta que resulte lo 
suficientemente básico para servir de punto de convergencia a nuestros esfuerzos de integración. 
A pesar de que se han sugerido diversas variables dependientes que podrían cumplir con esta 
función, los psicólogos no han llegado todavía a ningún acuerdo substancial respecto a ellas. 
¿Debemos concentrar nuestra atención en los aspectos temporales de la conducta, en sus 
características especiales o en sus propiedades de intensidad?, para citar sólo un reducido número 
de alternativas. Las variables independientes de las que es función la conducta presentan 
problemas similares. ¿Cuáles, de entre la multitud de variables que afectan la conducta, 
resultarán más eficaces con vistas a constituir un marco para la sistematización? 


Las respuestas a estos problemas son críticas para una ciencia de la conducta, del mismo modo 
que lo han sido para otras ciencias. La química no hubiera podido erigirse en una ciencia moderna 
sin antes haber reconocido que el peso, y no el color, constituía la variable crítica. La física 
experimentó una revolución cuando, por medio de la equivalencia entre masa y energía, se redujo 
a Una el número de variables básicas. 


Para conseguir una sistematización, a partir de unas variables que se han demostrado comunes a 
diversas situaciones, será necesario diseñar experimentos destinados a explorar el conjunto de 


variables que son relevantes para un fenómeno dado. Tal vez las consideraciones teóricas 
indiquen la dirección específica de dicha experimentación, pero el estudiante debe vigilar que su 
propia teoría no lo aprisione, puede que resulte posible solucionar el problema teórico mediante 
un experimento realizado con vistas a comprobar más de una suposición; sin embargo, por norma 
general, el estudiante debería verificar una amplia gama de valores de las variables en cuestión. 
En este caso, incluso si la teoría no consigue ningún apoyo, se habrán obtenido suficientes datos 
para que se revelen otras posibilidades de integración. Si el estudiante practica el método 
inductivo de un modo ágil y alerto, podemos predecir con seguridad que de sus experimentos 
resultará algún grado de sistematización que dará lugar a una serie de relaciones funcionales 
completas dentro de un área relativamente definida. 


La demostración de que una variable es relevante a una situación determinada quizá no sea 
reconocida como descubrimiento capital hasta que otras variables y situaciones experimentales 
diferentes hayan sido exploradas. Es frecuente que tales datos permanezcan aislados hasta que 
descubrimientos posteriores los sitúen en su lugar adecuado dentro de un esquema sistemático 
más amplio. El artículo de Skinner “Superstición en la paloma”? constituye un espectacular 
ejemplo de reconocimiento tardío (ver página 331). Durante varios años, los datos que Skinner 
cita en dicho artículo fueron considerados como una curiosidad interesante solamente. Hace poco 
tiempo, las variables implicadas ha demostrado ser, sin embargo, de importancia capital en una 
gran variedad de situaciones experimentales y clínicas. Algunos teóricos aseguran ahora que la 
mayor parte de la conducta humana se halla bajo el control de “falsas” contingencias similares a 
las descritas por Skinner. Se han observado fenómenos conductuales atribuibles a contingencias 
de reforzamiento accidentales, en situaciones experimentales que van desde estudios sobre 
adaptación a la oscuridad hasta investigación del castigo, y estas contingencias están empezando 
a jugar un papel unificador en la sistematización de una gran variedad de datos. 


Si se desean explorar las condiciones bajo las que un fenómeno dado tiene lugar, ¿cómo se 
determinan las variables con que debemos trabajar? No existe respuesta tajante a esta pregunta. 
Podemos seleccionar las variables que son significativas para una teoría determinada, basarnos 
en análogos procedentes de fenómenos parecidos acerca de los cuales se tiene mayor 
información, o también puede escogerse una variable determinada por una razón de la que no se 
es completamente consciente y no se sabe verbalizar adecuadamente. Ni estos ni otros métodos 
de selección tienen nada que ver con la importancia de los datos resultantes. Una variable puede 
demostrar ser de la máxima importancia en contextos totalmente insospechados por le 
experimentador o puede, asimismo, revelarse secundaria y de importancia sistemática intima. 
Puesto que la dirección que tomarán los progresos futuros es siempre incierta, el estudiante no 
debe tratar de tomar nunca una decisión definitiva sobre la importancia de cualquier variable 
descubierta. 


¿CÓMO EVALUAR LA IMPORTANCIA DE LOS DATOS? 


Al discutir la importancia de los datos experimentales, he tomado en consideración muchas 
facetas de la ciencia. Tal vez he dado la impresión de divagar y de separarme mucho del tema que 
nos ocupa, pero ello se debe a su propia naturaleza. El problema de evaluar la importancia de los 
datos experimentales no puede solucionarse mediante una argumentación corta o pulida. Es un 
problema de igual magnitud que la ciencia misma, y el científico con tradición experimental 
reconocerá que mi examen, lejos de ser demasiado exhaustivo, ha resultado demasiado limitado. 
Sin embargo, lo que probablemente más preocupe al estudiante, después de haber leído las 
páginas precedentes, será la impresión de que no ha recibido ninguna respuesta definitiva. Se ha 
planteado un problema, pero no se le ha dado solución alguna. He mencionado varios tipos de 
datos y varias razones por las que experimentar y, aunque la importancia de dichos datos suele 
juzgarse según esas razones, he intentado (a pesar de ms prejuicios, sin duda evidentes) llegar a la 
conclusión de que aquellas razones no constituyen, de hecho, un fundamento adecuado para 
enjuiciar. 


¿Con qué debemos, pues, sustituirlas? Se supone que la ciencia es un proceso lógico y ordenado, 
que no se encuentra sujeto a la arbitrariedad de los prejuicios y otras flaquezas humanas de 
quienes la practican. Si la ciencia ha de usar la importancia de los datos como criterio para aceptar 
o rechazar un experimento, es presumible que debe disponer de un conjunto imparcial de reglas y 
normas bajo las cuales el científico pueda operar al hacer sus evaluaciones. Sin embargo, la 
respuesta a si tales reglas existen en realidad es, rotundamente, no. 


Si he puesto al estudiante en un aprieto y he dejado que se las componga por sí mismo, lo he 
hecho totalmente a propósito; aunque lo deseara no puedo prestarle mayor ayuda. Tanto si le 
gusta o no, se hallará en este aprieto el resto de su vida científica. Si el estudiante se ha 
introducido en la ciencia con la ilusión de encontrar un modo de actuar en el que un conjunto de 
normas fijo le garantice una seguridad y le salvaguarde de todo error, le conviene conocer la 
realidad cuanto antes mejor. Algunos científicos, o bien nunca se dan cuenta de que se hallan 
sobre arenas movedizas, o bien rechazan esta idea y pretenden que sus pies se hallan sobre tierra 
firme. No dudan en condenar la labor de sus colegas tachándola de carente de importancia, 
puesto que para ellos la importancia se circunscribe, por definición, a su propio conjunto de 
normas. Esta postura proporciona seguridad, pero lo hace a expensas de la objetividad, que es el 
primer requisito para que una ciencia sea eficaz. 


No recomiendo, sin embargo, que el estudiante intente seguir el hilo de todos los datos que le 
llamen la atención, aceptándolo de un modo fatalista como una obligación y aspirando a 
convertirse en el Hombre Universal. Tal como Bachrach ha dicho, "ser ecléctico puede... significar 
que se tienen los pies firmemente asentados en el aire” (a, p. 43). El estudiante debería tener 
algún tipo de convicción en lo que se refiere a qué tipo de datos son los que su ciencia necesita 
más urgentemente. Ello dará una dirección definida a su investigación, y le proporcionará una 
unidad de criterios que le permita hacer una contribución más sustancial. Sin embargo, nunca 
debe llegar a centrar su atención en sus propias convicciones tan fijamente como para desconocer 


datos metodológicamente correctos que surjan de enfoques distintos al suyo, y, a medida que la 
ciencia progresa, debe ser capaz de cambiar las directrices de su investigación dejándose llevar 
por los nuevos adelantos. 


El avance acumulativo de una ciencia proporciona la única respuesta final en lo que toca a la 
importancia de cualquier dato en particular. Son a veces los científicos jóvenes, que entran en 
materia libres de antiguas controversias, quienes recogen los hilos de continuidad de entre la 
maraña de teorías, datos y falsos problemas que acompañan al progreso científico en cada 
estadio de su desarrollo. 


II. Fiabilidad y generalidad de los datos 


La importancia científica constituye, solamente, uno de los criterios utilizados para evaluar datos. 
Ya he dicho que este criterio es, en el mejor de los casos, una base poco sólida para aceptarlos o 
desecharlos. El resto del libro lo dedicaré a otros dos criterios, la fiabilidad y la generalidad, a lo 
que este capítulo puede servir de introducción general. 


Tal como ocurría con la importancia de los datos, la valoración de su fiabilidad y generalidad 
requiere asimismo una gran madurez de juicio. Hay sin embargo muchos psicólogos que insisten 
en que la fiabilidad y generalidad deben evaluarse desde un enfoque puramente impersonal. 
La popularidad con que cuenta este punto de vista se debe posiblemente a que el psicólogo se da 
cuenta, en virtud de la naturaleza de su objeto de estudio, de las flaquezas del juicio humano. 
No le atrae la idea de confiar las decisiones importantes a los caprichos de un juicio personal. 
Sin embargo, el juicio personal no es, de ningún modo, sinónimos de antojo o capricho y, aunque 
puede no estar fundado en la lógica y quizá sea imposible expresar sus resultados 
numéricamente, se trata indudablemente de algo muy tangible que ha demostrado 
prácticamente su eficacia. Los errores no quedan descartados, pero existen métodos para 
detectarlos y corregirlos. La objetividad de la ciencia consiste, no tanto en un conjunto de normas 
de procedimiento, como en la naturaleza autocorrectiva del proceso científico. 


En los libros de textos que versan sobre método experimental raras veces se menciona la 
importancia del juicio sensato en la evaluación de la fiabilidad y generalidad de los datos 
experimentales. Sin embargo, juega un papel primordial en dicha evaluación, y un cabal 
conocimiento de este hecho general resultará más valioso que cualquier técnica individual de 
valoración descrita en los capítulos siguientes. 


FIABILIDAD 


Cuando nos preguntamos s unos datos determinados son fiables, normalmente queremos decir: 
“¿Obtendremos los mismos resultados si repetimos el experimento?” En psicología, se suele 
responder a esta pregunta por medio de un elaborado conjunto de supuestos estadísticos y 
cómputos aritméticos. 


El principal antagonista de la fiabilidad estadística lo constituye el “Azar”. El Azar ha sido erigido 
por la psicología moderna en su demonio particular. De este modo, se considera que todos los 
datos llevan su mácula desde que nacen, y todo dato que no pueda demostrar su inconexión con 
el Azar es inmediata e irreversiblemente condenado a su propio infierno. Es ésta una teología 
realmente severa, puesto que sostiene que la marca del Azar no puede nunca ser borrada por 
completo de ningún dato. A lo más que podemos aspirar es a determinar que los datos específicos 
poseen una baja probabilidad de pertenecer al Azar, y no sin cierta desconfianza los admitimos en 
el redil. Si no pertenecen al Azar, pertenecen a la Ciencia, y de este modo son aceptados dentro 


de ella por exclusión. Estos datos no poseen virtudes positivas, sino Únicamente la propiedad 
negativa de no pertenecer al Azar aunque siempre con un pequeño riesgo de que al aceptarlos nos 
hayamos equivocado. 


La noción de azar no significa para la ciencia lo que para el hombre de la calle. Para él, azar es 
sinónimo de impredictibilidad, y sin embargo existe una ciencia del azar. ¿Y quién ha oído hablar 
nunca de una ciencia cuyo objetivo de estudio fuera impredictible? De hecho, existen leyes del 
azar, y siempre que hay una ley hay predictibilidad. Es, pues, la existencia de tales leyes la que 
permite a los científicos evaluar la fiabilidad de sus datos en relación a las líneas de base que 
proporciona la teoría estadística. 


Supongamos, por ejemplo, que se han llevado a cabo dos conjuntos de observaciones 
cuantitativas, una bajo condiciones de control y la otra siguiendo algún tipo de manipulación 
experimental. Resultarán de ello dos conjuntos de números comparables. Podemos preguntarnos 
a continuación si la diferencia entre las medias, por ejemplo, de los conjuntos de números, es 
fiable. Es decir, si el experimento se hubiera llevado a cabo obteniendo ambos conjuntos de 
números bajo condiciones de control solamente, ¿podría haber resultado una diferencia 
comparable puramente producto de las variaciones al azar? El experimentador escrupuloso 
empezará por argUir que al diferencia observad no es fiable, sino que fue debida al azar. 
A continuación comenzará a trabajar para demostrar que él mismo se equivoca. Si sólo actuara el 
azar y Si la variable experimental realmente no ejerciera ningún efecto, esto significaría que los 
dos conjuntos de número obtenidos eran tan sólo muestras de una misma población, poseedora 
de ciertas características cuantitativas. Probablemente nuestro científico haga entonces algunas 
conjeturas sobre la distribución numérica dentro de esta población, a partir de las cuales 
determinará s era razonable esperar que resultaran los números obtenidos al haberlos extraído al 
azar de aquella distribución. Si sus cálculos le indican que sólo hay una ligera probabilidad de que 
los dos conjuntos de números observados procedan de la misma distribución original, concluirá 
que la diferencia era real y los datos fiables. 


El análisis estadístico tiene sus ventajas en lo que se refiere a algunos tipos de experimentos, 
aunque también conlleva algunas dificultades graves. Por ejemplo, la población principal con que 
se deberán comparar los datos empíricos presenta un problema, puesto que aunque idealmente 
la forma y los parámetros de la distribución original deberán haberse determinado 
empíricamente, rara vez ocurre así. Postular las características de tal distribución conlleva un 
grave riesgo, puesto que el número de distribuciones posible entre el que coger es infinito. 
Particularmente arriesgada, debido a las características de círculo vicioso que presenta, es la 
práctica, frecuente en otro tiempo, de deducir las propiedades de la distribución en la población 
principal a partir de los datos que se estudian. Actualmente, esta práctica está perdiendo adeptos. 
Incluso la llamada estadistica sin distribución no escapa totalmente a este dilema, puesto que 
siempre se requiere alguna distribución de referencia con la que comparar las observaciones 
empíricas. 


La incógnita de si repitiendo el experimento se continuaría observando una diferencia 
comparable o igual entre los datos de control y los experimentales, da lugar a un segundo tipo de 
problema de fiabilidad, distinto del que implicaba la cuestión de si se podía inculpar el azar por la 
diferencia obtenida en un experimento, y que más bien constituye un problema de replicación. 
Una operación experimental dada puede, de hecho, no tener ningún efecto significativo. 
Sin embargo, es probable que una serie de repeticiones del mismo experimento dé lugar a 
algunos cálculos de diferencias estadísticamente significativas entre las observaciones efectuadas 
en el grupo de control y el experimental. En una serie de replicaciones de un mismo experimento 
puede esperarse que tenga lugar algunas veces una diferencia estadísticamente significativa 
imputable únicamente al azar. De un modo similar, incluso si la variable experimental ejerce un 
efecto real, puede esperarse que una serie de replicaciones dé lugar a algunas pocos casos son 
significación estadística. Así pues, un único experimento asilado está sujeto a estos dos tipos de 
error, y un juicio estadístico sobre su significación o no significación, puede ser en sí mismo 
producto del azar. 


Nos queda, finalmente, el problema básico de qué es lo que se quiere designar con la palabra 
“azar”. Las observaciones experimentales, ¿son alguna vez producto del azar? Para algunos 
experimentadores, el azar es simplemente un término que se usa para designar los efectos 
combinados de variables incontroladas. Si tales variables son, de hecho, controlables, el azar 
empleado en este sentido es solamente una excusa de una experimentación deficiente, y no 
necesitamos hacer más comentarios sobre ello. Si las variables incontroladas son totalmente 
desconocidas, el azar es, tal como ha dicho Boring,** un sinónimo de ignorancia. Se supone que la 
ciencia está orientada a erradicarla y sin embargo, la evaluación estadística de los datos con 
referencia a una línea de base cuyas características están determinadas por variables 
desconocidas, constituye una aceptación pasiva de ignorancia. Es ésta una curiosa negación de 
las metas declaradas de la ciencia. Más compatible con estas metas, es la evaluación de datos por 
medio del control experimental, alternativa formada por un conjunto de técnicas que constituirán 
el tema central de los capítulos siguientes. 


Alguien puede aceptar que el azar es sinónimo de ignorancia, arguyendo, sin embargo, que la 
estadística es necesaria con vistas a conocer el grado de la propia ignorancia. Partiendo de la 
información obtenida por este método, puede utilizarse el control experimental para identificar, y 
por consiguiente disminuir, el papel de los factores incontrolados, y el procedimiento no puede 
condenarse si tiene éxito. Sin embargo, tal como explicaré más adelante, la evaluación de la 
variabilidad incontrolada debe tomar en consideración un cierto número de factores que no son 
susceptibles de ser sometidos a ningún tratamiento estadístico conocido, y que también suelen 
ser, de hecho, en gran medida subjetivos e idiosincráticos de un experimentador o laboratorio 
particular. Incluso entre aquellos que defienden la utilidad de las técnicas evaluativas estadísticas, 
puede admitirse la prioridad de estas otras consideraciones que he mencionado. 


Para algunos experimentadores, azar significa lo mismo que para el hombre de la calle, es decir, 
impredictibilidad. Sin embargo, la verdadera incapacidad de predecir dejaría sin trabajo al 
verdadero científico. Si se refiere al tipo de impredictibilidad estadística que se ha hecho popular 


en física, se verán obligados a buscar las leyes estadísticas que gobiernan tal “impredictibilidad”, y 
basar sus comprobaciones de la fiabilidad de los datos en estas leyes, más que en los supuestos 
que se han derivado de la estadística de inferencia. 


GENERALIDAD 


Los problemas como los de arriba planteados no son nuevos, ni mucho menos. Éstos y otros han 
sido reconocidos por los matemáticos estadísticos y los psicólogos que utilizan la estadística desde 
hace mucho tiempo, y continuamente se les está buscando solución. 


La evaluación de la generalidad de los datos se halla en una situación similar. Los métodos 
estadísticos se han convertido casi en una situación sine qua non para determinarla. Sin embargo, 
la generalidad tiene varios significados, y los métodos estadísticos, aunque estuvieran libres de sus 
propias dificultades intrínsecas, no serían aplicables al estudio de todos los tipos de generalidad 
existentes. 


GENERALIDAD DE UN SUJETO EXPERIMENTAL O REPRESENTATIVIDAD 


Si se ha obtenido un resultado experimental dado con un único sujeto, ¿hasta qué punto es este 
resultado representativo de otros organismos de la misma especie? Esta pregunta es 
engañosamente simple ¿En qué aspecto de los datos se desea comprobar su generalidad? 
¿Se trata simplemente del hecho de que una variable sea operativa? ¿Es la forma general de una 
relación funcional lo que interesa? ¿O acaso se consideran críticos los valores cuantitativos y los 
números? Es precisamente al responder a estas preguntas que deben tomarse en cuenta los 
propósitos del experimentador, puesto que a menudo, en psicología, algunos aspectos de un 
experimento muestran una ordenación apreciable, mientras que otras características de los 
mismos datos parecen caóticas. El experimentador deberá ocuparse entonces de la 
representatividad de estas porciones de datos que muestran un orden. La ciencia rara vez trata de 
estudiar el desorden por sí mismo, puesto que le progreso tiene lugar sólo cuando logramos 
colocar bajo control los datos aparentemente caóticos. Es por esta razón que no se suelen criticar 
los datos experimentales cuando no muestran regularidad de ningún tipo. La única excepción 
tiene lugar cuando es razonable suponer que la variabilidad puede haber oscurecido, o interferido 
de algún modo, los datos críticos. 


Una vez que el experimentador ha puesto de manifiesto las características de los datos que de un 
modo particular le interesan, ¿cómo se las debe arreglar para determinar su generalidad? 
Este problema se discutirá con detalle en los capítulos sobre replicación, aunque es pertinente 
hacer un comentario negativo aquí. No podemos deshacernos del problema de la generalidad de 
un sujeto a base de emplear grandes grupos de sujetos experimentales y utilizar medidas 
estadísticas tales como la media y la varianza de los grupos. No es verdad que cuanto mayor sea el 
grupo, mayor será la generalidad de los datos que obtengamos. La representatividad es un 
problema de constatación de hechos, al cual no se puede aplicar el diseño estadístico que 


prevalece actualmente. Supongamos que, por ejemplo, se somete un grupo de sujetos a una 
manipulación experimental dada, y que se obtiene de ella una medición conductual expresada 
mediante la media y la desviación estándar. Entonces podemos preguntarnos: ¿qué grado de 
representatividad tienen estos datos? ¿A cuántos sujetos de la población pueden aplicarse? 


El primer problema consiste en seleccionar aquel aspecto de los datos cuya generalidad se desee 
estudiar. Tal vez se dirija la atención a la generalidad de la forma particular que toma la 
distribución obtenida. La razón por la que la investigación experimental en psicología nunca se ha 
llevado lo suficientemente lejos como para proporcionar esa información es muy simple: 
representaría una labor tremenda y no merecería la pena. Una amplitud tal de especificación daría 
lugar a un grado de generalidad en el que no podría haber, por definición, excepción alguna. 
Todo dato sería automáticamente representativo. 


Por consiguiente, se selecciona un aspecto restringido de la distribución para poner de relieve sus 
características. Por ejemplo, podemos preguntar cuán representativo es el valor de la media, de 
todos los sujetos de la población. En la práctica, esta pregunta rara vez suele ser contestada. Si así 
fuera, leeríamos con frecuencia en informes publicados, no sólo el valor de la media del grupo sino 
también el número de sujetos que de hecho caen dentro de este valor. Si el grupo fuera lo 
suficientemente numeroso podríamos declarar que el 30 por ciento, por ejemplo, de los individuos 
arrojan un valor medio (representado por la letra y) en una medición conductual. Ésta sería la 
expresión correcta del grado de representatividad de la media del grupo, y constituye el tipo de 
información útil al estadístico de una compañía de seguros o al psicólogo interesado en la 
distribución en una población de determinadas características conductuales. En realidad, hay 
pocos psicólogos experimentales que estén interesados en distribuciones poblacionales un gran de 
este tipo, puesto que si existiera un gran interés veríamos más datos experimentales expresados 
no en forma de mediciones conductuales simplemente, sino más bien por el número de sujetos 
que muestran cada valor de medición conductual en cuestión. A no ser que los datos 
experimentales se expresen de este modo, el uso de grandes grupos de sujetos no aporta nada a 
la representatividad de los descubrimientos. Asimismo, a menos que se conozca la forma en que 
se distribuye una población, es imposible determinar la representatividad dentro de la especie 
partiendo simplemente de la media y la desviación estándar de la distribución de una muestra 
experimentalmente obtenida. 


Los métodos estadísticos encaminados a afianzar la generalidad de las mediciones efectuada en 
los sujetos experimentales parecen indiscutiblemente necesarios debido a la gran variabilidad que 
comúnmente se observa entre ellos en los experimentos conductuales. Desgraciadamente, y 
debido a un diseño experimental insuficientemente elaborado, el fenómeno de la variabilidad 
parece haber recibido poca atención en el laboratorio. Sin embargo, al aumentar el interés por la 
conducta individual, parece que están surgiendo algunos datos elementales sobre la variabilidad, 
datos que hacen posible una aproximación distinta al problema de la generalidad de los 
descubrimientos realizados en un sujeto. En el tradicional y todavía popular experimento 
psicológico, dos grupos de sujetos son expuestos por separado a dos valore distintos de alguna 
variable independiente. Mientras que cada grupo puede arrojar un valor medio de la conducta 


resultante distinto, habrá una dispersión alrededor de estas medias, siendo muy posible que tenga 
lugar alguna superposición entre algunos valores de los dos grupos. La pregunta tradicional 
concerniente a la generalidad en una situación como ésta ha sido: “¿Hasta qué punto los sujetos 
de los dos grupos son representativos de la población total, si todos sus miembros pudieran 
haberse expuesto a uno u otro de estos valores de la variable independiente?” 


La pregunta sólo sirve para defraudar al inquiridor. Un numero de experimentos lo 
suficientemente grande ha demostrado que la conducta del sujeto individual es una función 
ordenada en la que se actúan un gran número de variables llamadas independientes, y, desde 
luego, podemos dar por sentado que una ordenación tal constituye la regla más que la excepción. 
Las variaciones ente sujetos suelen derivarse de diferencias en los parámetros de las relaciones 
funcionales entre la conducta y las condiciones que la controlan. Por ejemplo, la relación funcional 
entre dos variables puede ser lineal, con individuos que difieran solamente en la pendiente y los 
puntos de intersección de la función con los ejes (ver figura 1). O bien las curvas que expresan la 
relación entre dos variables tal vez pasen por un máximo, que tendrá coordenadas distintas en 
cada sujeto (tal como ocurre en la fig. 2). Cualquier grupo suficientemente grande de sujetos 
mostrará una variabilidad conductual compatible con la distribución en la población de los 
parámetros de la relación funcional. En la figura 1, por ejemplo, es probable que la mayor parte de 


la población se parezca al sujeto S2. 
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VALORES DE LA 
VARIABLE INDEPENDIENTE 


FIGURA 1. Conjunto de curvas pertenecientes a una población hipotética de sujetos 
experimentales. La conducta de cada sujeto es función lineal de la variable independiente, aunque 
cada recta tiene distinta pendiente y puntos de intersección con los ejes. 


Si la muestra, que suponemos adecuada, se somete al valor X de una variable experimental, las 
medidas conductuales se agruparán alrededor del valor Y2. Sin embargo, algunos con los valores 
conductuales representados por Y1, Y3 e Y4. El número de sujetos que se incluyan en cada clase 
dependerá de la distribución en la población de aquellos factores que producen las diferencias en 
la pendiente y puntos de intersección con los ejes de las curvas individuales. 


La figura 2 puede analizarse del mismo modo. El tipo de relación no lineal mostrado aquí servirá 
también para destacar más claramente otro aspecto de la variabilidad. Los sujetos S3 y S4 
muestran respuestas cuantitativamente muy similares al valor X de la variable experimental. Sin 
embargo, este valor de la variable independiente en realidad encuentra a los sujetos S3 y S4 en 
fases marcadamente distintas del proceso que representa la función no lineal. El diseño de grupos 
tradicional no revelaría nunca este fenómeno, puesto que las funciones individuales no son 
examinadas ni tan sólo obtenidas. Nos encontramos aquí, pues, ante un caso en que se atribuiría 
una generalidad falsa a los datos. La similitud cuantitativa de la conducta de los sujetos que no es 
más que una falacia de un diseño experimental que no permite ningún análisis de las causas de 
variabilidad. 


VALORES DE LA VARIABLE INDEPENDIENTE 


FIGURA 2. Conjunto de curvas pertenecientes a una población hipotética de sujetos 
experimentales. La conducta de cada sujeto pasa por un máximo al aumentar el valor de la 
variable independiente, aunque en cada curva este máximo corresponde a un valor distinto de las 
abscisas. 


Las diferencias o similitudes cuantitativas ente sujetos en puntos aislados únicos de una relación 
funcional no proporcionan un criterio apropiado con el que evaluar la representatividad de los 
datos experimentales. Además, a nadie le interesa realmente, a menos que sea con vistas a ciertas 
aplicaciones prácticas, saber cuántas ratas, por ejemplo, emiten 100 respuestas de extinción 


después de 20 reforzamientos, cuántas emiten 200, etc. Tal variabilidad sólo puede interesar al 
investigador sistemático en la medida en que le indica que no posee ni la información, ni la 
habilidad técnica para obtener los datos en que está realmente interesado. Esto le recuerda que 
queda una gran cantidad de trabajo por realizar antes de poder tan sólo a fijar el grado de 
representatividad de sus datos. La dispersión alrededor de un valor medio proporciona escasa 
información sobre las relaciones funcionales, tal como ocurre en las figuras 1 y 2, cuya variabilidad 
se refleja en dicha dispersión. Si s e puede demostrar que un facto dado actúa según el mismo tipo 
de función en los individuos de una población, puede decirse que el descubrimiento posee una 
considerable generalidad, a pesar de que se continúen observando diferencias cuantitativas. Es de 
la generalidad de tales relaciones funcionales que debemos ocuparnos en primer lugar, y no de la 
representatividad de unos números concretos sacados fuera de su contexto. 


No he expuesto todo esto para sugerir que la variabilidad cuantitativa puede ser ignorada, como 
se defenderá en capítulos más avanzados. Se ha tocado este tema aquí con el único fin de ilustrar 
a falta de adecuación de las concepciones tradicionales sobre la variabilidad al determinar la 
representatividad de los hallazgos experimentales. Probablemente merezca la pena, en este 
punto, dedicar algo de atención a aquellos que se lamentan de este modo: “Pero, ¿qué ocurrirá 
con los problemas experimentales que no son, por su propia naturaleza, susceptibles de ser 
investigados en sujetos individuales? ¿no es acaso la tradicional evaluación estadística de la 
generalidad el único camino a seguir en estos casos? ” 


La primera respuesta a esta pregunta quejumbrosa es que tales casos son cada vez menos 
frecuentes. Nuevas e ingeniosas técnicas han reducido considerablemente el número de 
fenómenos conductuales que sólo arecen susceptibles de tratamiento estadístico en grupos, y 
puede esperarse mucho más a medida que el control experimental se vaya refinando. 
Sin embargo, la clave de todas estas técnicas reside en la reversibilidad de los fenómenos 
conductuales, dado que, si una manipulación produce un cambio irreversible en el aspecto de la 
conducta del sujeto que estamos observando, puede resultar muy difícil, si no imposible, 
establecer relaciones funcionales del tipo representado en las figuras 1 y 2. Y, aunque los datos de 
que disponemos hasta ahora apenas permiten sacar ninguna conclusión, algunos procesos 
conductuales pueden desde luego resultar irreversibles. 


En el caso de que nos tuviéramos que enfrentar con una irreversibilidad real, disponemos todavía 
de una solución sumamente directa: estudiar los procesos irreversibles tal y como tienen lugar en 
la naturaleza. Un proceso irreversible debe ser aceptado como tal, y las técnicas para estudiarlo 
deben tomar en consideración la característica de irreversibilidad si puede demostrarse que nos 
encontramos ante una irreversibilidad real, debemos admitirla como una propiedad fundamental 
de la conducta en que se presente, y de ningún modo podemos soslayarla. La estadística de 
grupos no es, ciertamente, la solución, puesto que un proceso conductual irreversible dado existe 
en el individuo, y no presenta continuidad de un grupo de sujetos a otro. 


Tomemos, como un ejemplo, el clásico problema de la relación entre el número de reforzamientos 
y la resistencia a la extinción, y aceptemos, sólo por un momento, el supuesto de que una 


exposición a la extinción experimental ejerce un efecto irreversible sobre exposiciones ulteriores. 
Esta suposición parece que condena al fracaso cualquier intento de utilizar un único sujeto 
experimental para determinar la relación funcional entre el número de reforzamientos y la 
resistencia a la extinción, puesto que ello requeriría exponer al sujeto repetidas veces al 
procedimiento de extinción, que seguiría a períodos interpolados de recondicionamiento con un 
número variable de reforzamientos. Es de suponer que las sucesivas operaciones de extinción 
resultarían contaminadas por las precedentes, y los datos resultantes no serían puramente función 
del número de reforzamientos, sino que también dependerían de las operaciones de extinción 
previas. 


La solución usual a este problema ha consistido en exponer a grupos separados de sujetos a cada 
valor de la variable independiente, es decir, el número de reforzamientos, y acto seguido, someter 
cada grupo a la extinción experimental sólo una vez. Los resultados de este procedimiento nos 
proporcionarán alguna información práctica de utilidad. Si tratamos los datos adecuadamente. 
Podremos hacer un cálculo del número de reforzamientos que debemos dar a un sujeto si 
deseamos, por alguna razón experimental, generar una resistencia a la extinción determinada, y el 
grado de precisión que necesitemos dependerá del trabajo concreto que estemos realizando. 
Sin embargo, la función que obtengamos con estos cálculos no será representativa de ningún 
proceso conductual, puesto que el uso de grupos separados destruye la continuidad de causa y 
efecto que caracteriza a un proceso conductual irreversible. Los datos sobre la extinción “no 
contaminada” obtenidos en grupos separados darán lugar a una relación funcional que no tiene 
contrapartida en la conducta del individuo, mientras que la función obtenida mediante un solo 
individuo es el resultado de un proceso de interacción que se extiende de un segmento a otro de 
la conducta del sujeto. Los puntos de la función obtenida empíricamente utilizando grupos 
separados no presentan entre sí este tipo de relación. 


Si resulta realmente imposible obtener una relación no contaminada entre el número de 
reforzamientos y la resistencia a la extinción en un sujeto único, debido al hecho de que las 
extinciones sucesivas se influyen recíprocamente, podemos concluir simplemente que no existe tal 
relación “pura”. La solución al problema consiste en cesar en nuestros intentos de descubrir dicha 
relación pura y dirigir la investigación hacia el estudio de la conducta tal como se muestra de 
modo natural, puesto que si la reversibilidad no existe en la naturaleza, tampoco existirá en el 
laboratorio. 


El hecho de que una función de grupo pueda carecer de contrapartida en el ámbito de la conducta 
del individuo es independiente de la cuestión de si una curva perteneciente a un grupo puede 
tener la misma forma que la curva individual. Aunque este segundo problema ha sido tratado con 
gran amplitud (5, 27, 41, 55 y 68), el caso que he presentado aquí ilustra cómo las curvas 
individual y de grupo simplemente no pueden proporcionar la misma información, incluso 
poseyendo formas idénticas. La distinción entre los dos tipos de función puede llevarse a cabo, no 
a partir de un razonamiento matemático o lógico, sino más bien basándonos en los dos tipos de 
fenómenos conductuales que representan. Allí donde nos topemos con la irreversibilidad no existe 
ninguna curva individual que pueda proporcionar la información que se pediría a la curva del 


grupo y viceversa. Sin embargo, ello no debería lleva al estudiante a la creencia de que, en todo 
caso, el tipo de experimento en grupo puede proporcionar un substitutivo más generalizable o 
más adecuadamente controlado de los datos individuales. 


Si lo hasta aquí dicho suerte el efecto que me había propuesto, el estudiante debería sentirse 
impulsado a reconsiderar una gran parte de los datos supuestamente sistemáticos de la psicología 
experimental. Se dará cuenta de que, a menudo, no se ha hecho esta distinción entre los dos tipos 
de datos, individuales y de grupo, y que, por consiguiente, se hayan entremezclados dentro de un 
esquema sistemático único. Como consecuencia de ello, queda por hacer la enorme labor de 
desembrollarlos. Una vez que el estudiante haya llevado a cabo esta labor, probablemente 
concluya que debe abandonar muchas de las más preciadas generalizaciones de la psicología, y es 
también muy probable que se vea obligado a efectuar una elección, dado que los dos tipos de 
datos representan, de hecho, dos objetos de estudio totalmente distintos. En realidad se 
encontrará con que algunos experimentadores y sistematizadores de la psicología ya han tomado 
su decisión acerca de qué datos, los individuales o los de grupo, constituirán la base de la ciencia 
que intentan construir. Esta elección no significa en absoluto estrechez de intereses, sino que a 
menudo es el resultado de una decisión consciente y meditada acerca del tipo de datos que 
resultan más apropiados para una ciencia de la conducta. En todas las áreas de la ciencia hay 
momentos críticos en que deben tomarse este tipo de decisiones, y sus consecuencias son de 
largo alcance. Si la mayoría de los científicos aceptan la decisión correcta, la ciencia avanzará, 
mientras que si la solución adoptada es la incorrecta, su ciencia sufrirá un período de 
estancamiento hasta que se arregle la situación. Si no se toma ninguna decisión, el resultado será 
irremisiblemente una confusión de datos y principios básicamente incompatibles. Bajo el 
argumento de que el eclecticismo es el camino hacia la generalidad, puede esconderse la trampa 
de la indecisión. 


GENERALIDAD ENTRE ESPECIES 


¿Son los descubrimientos experimentales realizados en una especie generalizables a otras 
especies de organismos? Ello constituye el problema de la generalidad entre especies, cuyo 
pasado histórico es de lo más desgraciado, y aún hoy la solución propuesta por muchos psicólogos 
es uno de los últimos vestigios de la falacia que considera al hombre el centro del universo. 
El cambio evolutivo se acepta en otras áreas de la biología, a la vez que suele pretenderse que 
entre la Conducta Humana y la Conducta Infrahumana hay un salto discontinuo. Incluso aquéllos 
que están convencidos de que la conducta humana se ha desarrollado a lo largo de un proceso 
evolutivo normal, todavía creen que el hombre es algo especial. Además, no sólo se proclama que 
la conducta humana es en principio distinta de la de otros organismos, sino que se alega a veces 
que la conducta de cualquier especie también difiere substancialmente de la de su inmediata 
inferior. Con cada paso dentro de la evolución es de suponer que ha tenido lugar algún avance 
hacia la realización final, de la cual se supone que el psicólogo es un ejemplo. 


Este prejuicio ha dado lugar a una curiosa solución del problema de la generalidad de los datos 
conductuales obtenidos con una especie determinada. La psicología diferencial se ha convertido 
en una disciplina orientada en gran medida a descubrir las diferencias en la conducta de varias 
especies de organismos, y cuando se han hallado similitudes —que por otra parte suelen constituir 
el objeto d estudio de las demás ciencias—, han sido descartadas como fenómenos sin importancia. 
Desde esta óptica las diferencias que apuntan hacia el desarrollo de procesos de orden superior a 
medida que nos aproximamos al hombre a lo largo de la escala filogenética, se toman en 
consideración como si fueran los únicos datos comparativos de valor. 


Una psicología diferencial que intenta determinar diferencias más que similitudes entre las 
especies, tienen un fácil camino que recorrer, puesto que las diferencias no son nada difíciles de 
hallar. Todo experimento en el que la especie sea la variable primordial implicará también 
diferencias en otras variables importantes relacionadas con el continuum de las especies. 
Por ejemplo, los gatos difieren de los monos no sólo en la clasificación filogenética sino también 
en los tipos y cantidades de reforzadores que mantienen su conducta, en los tipos y niveles de 
deprivación que son posibles en ellos, en habilidad manipulativa, en la agudeza de sus sentidos, en 
duración de vida, etc. Debido a la dificultad de equiparar todos estos factores, es mucho más 
probable que las diferencias entre especies surjan de dichos factores que de una clasificación 
filogenética per se. 


Examinemos ahora un experimento hipotético de psicología diferencial. Se coloca un grano de uva 
en presencia de un mono, y mientras el animal está mirándola colocamos la fruta bajo una de dos 
cajas distintas. A continuación hacemos descender una pantalla entre el mono y las cajas, de 
modos que no las pueda ver ni alcanzar. Después de un período de tiempo determinado, se 
levanta la apantalla para que el mono tenga acceso a las cajas y les dé la vuelta, de modo que el 
experimentador observe si el mono escoge la caja “correcta”, o sea, la que tiene la uva debajo. 
El experimento se repite con intervalos de tiempo cada vez más largos entre el descenso y la 
subida de la pantalla, determinándose así cuál es el tiempo máximo durante el cual el animal 
puede “recordar” qué caja contiene el grano de uva. 


A continuación se lleva a cabo un estudio diferencial, empleando un perro como sujeto. 
Sin embargo, como los perros no suelen comer uva, estas se substituye por un pedazo de ternera. 
Supongamos que el mono es capaz de posponer su respuesta sin cometer ningún error por un 
período más largo que el perro. Puesto que evidentemente la posposición de una respuesta 
constituye una “función superior”, no deberá sorprender al psicólogo diferencial que el mono, 
pariente suyo mucho más cercano que el perro, sea el que se comporte mejor. 


Pero, ¿qué hubiera ocurrido si se hubiera privado al perro de comida desde tres días antes? ¿O si 
se hubiese colocado doble cantidad de carne en la caja? ¿O bien, si uno de los animales, o ambos, 
hubieran sido más jóvenes o más viejos? ¿Y si el experimento se hubiera llevado a cabo en la 
penumbra y no a plena luz? ¿O si la ternera y la uva se hubiesen substituido por carne de caballo y 
una naranja, respectivamente? Es perfectamente posible que factores como estos hubieran 


alterado los resultados del experimento, ya fuera aumentando la superioridad del mono, ya fuera 
dando la aventaja al perro. 


No existe ninguna salida satisfactoria a esta dificultad. Si fuera posible colocar ambas especies bajo 
condiciones óptimas, podríamos hacer una comparación de sus rendimientos óptimos, pero no 
disponemos por el momento de los conocimientos necesarios para montar un experimento de 
este tipo. Dada la situación en que nos encontramos, una variación en cualquiera de los 
parámetros conocidos o supuestos puede alterar nuestra evaluación de la generalidad de una 
especie en experimentos sobre la posposición de respuestas. ¿Dónde debemos investigar, pues, 
para poder calibrar la generalidad de una especie en los datos experimentales? Esta pregunta nos 
vuelve a situar ante la misma dificultad con que topamos en el caso de la generalidad de un sujeto, 
o sea, ¿generalidad de qué? A continuación citaré una lista, sólo parcial, de los tipos de 
generalidad que podemos estar interesados en determinar. (Podemos decir, de paso, que estos 
aspectos de la generalidad son importantes por sí mismos, independientemente de los problemas 
que plantee la generalidad de sujeto y de especie.) 


GENERALIDAD DE LAS VARIABLES 


En el estadio relativamente primitivo en que se halla la ciencia de la conducta es importante 
determinar si una variable o clase de variables dada es relevante más allá de los confines de un 
experimento concreto. La generalidad definida de este modo puede determinarse, ya sea 
alterando algunos aspectos del experimento original, ya sea llevando a cabo experimentos nuevos 
y sin relación aparente. Podemos emplear los mismos sujetos a lo largo de toda la investigación, o 
bien sujetos distintos, incluso de una especie totalmente diferente. Si podemos demostrar que 
una variable dada influye en la conducta en todos los experimentos que efectuemos, o aunque 
sólo lo haga en alguno de ellos, habremos logrado establecer una forma de generalidad. 


Por ejemplo, la intermitencia de reforzamiento es una variable de amplia generalidad respecto a 
su efecto sobre la resistencia a la extinción. Si una rata recibe un gránulo de comida cada vez que 
aprieta una palanca (reforzamiento continuo), emitirá un cierto número de respuestas incluso 
después que hayamos desconectado el mecanismo dispensador de gránulos de comida y no tenga 
lugar ningún otro reforzamiento (extinción). Sin embargo, si previamente reforzamos sólo aquellas 
respuestas que se produzcan después de transcurridos dos minutos, por ejemplo, desde el 
reforzamiento inmediatamente anterior, el número de respuestas que se emitirá posteriormente 
durante la extinción, o sea cuando se haya desconectado el mecanismo alimentador, será mucho 
mayor (81, páginas 133 y siguientes). El hecho de reforzar sólo una proporción relativamente 
pequeña de las respuestas del animal parece actuar sobre su conducta de modo que la hace más 
persistente después de que el reforzamiento ha sido totalmente retirado. Se ha establecido la 
generalidad de esta variable de varias maneras distintas. Por ejemplo, el reforzamiento 
intermitente aumenta todavía más la resistencia a la extinción al emplear distintos programas de 
intermitencia. Podemos administrar los reforzamientos después de períodos de tiempos variables 
en vez de fijos, o podemos poner dichos reforzamientos en función de un número fijo, o variable, 


de respuestas. Además, la intermitencia tiene un efecto similar sobre la conducta de extinción 
sometida a otros tipos de control distintos al del reforzamiento positivo. Si hacemos decrecer la 
tasa de una respuesta a base de castigarla ocasionalmente con shocks eléctricos, se requerirá un 
tiempo mayor para que la conducta vuelva a su tasas original después de acabado el castigo si éste 
era discontinuo, que si se había administrado de un modo consistente cada vez que la rata emitía 
una respuesta.?? Asimismo, si un animal recibe un shock inevitable al término de un estímulo de 
advertencia de, por ejemplo, cinco minutos de duración, la conducta en curso normalmente 
cesará hasta que acabe la presentación del estímulo mencionado.” Sin embargo, el animal volverá 
pronto a emitir la conducta si dejamos terminar el estímulo sin que lo acompañe ningún shock. 
Pero si en un principio los shocks se administran, no cada vez, sino sólo una pequeña proporción 
de las veces que se presenta el estímulo de advertencia, la conducta tardará mucho más en volver 
a la normalidad después de acabados los shocks.?* 


Además de estos y otros tipos de situación experimental, la intermitencia de reforzamiento ha 
demostrado ejercer un efecto similar en otras formas de respuesta y en otras especies, incluyendo 
la humana. A pesar de que la intermitencia no tiene el mismo efecto cuantitativo en todos los 
casos —se dan incluso algunas condiciones bajo las que decrece la resistencia a la extinción—, el 
hecho de que esta variable sea eficaz de un modo tan extendido constituye una generalización 
importante. 


Cuando se observan desemejanzas cuantitativas, el experimentador se enfrenta con un problema 
de investigación más amplio. En el caso de la intermitencia de reforzamiento, por ejemplo, un 
estudio más profundo ha revelado la existencia de un cierto número de factores concurrentes que 
pueden servir para atenuar, o modificar de algún otro modo el descubrimiento básico. Si los 
reforzamientos intermitentes se hacen depender de la emisión de un número fijo de respuestas, 
las características de la conducta de extinción subsiguiente diferirán notablemente de las que se 
observan en el caso en que lo reforzamientos se administren después de períodos de tiempo fijos 
(81, páginas 293 y siguientes). El estado de condicionamiento en el cual da comienzo a extinción, 
de igual modo que factores históricos más remotos, constituye también un factor relevante. 
Sin embargo, el hecho cualitativo de que una variable determinada opere en varios contextos 
experimentales distintos, así como con organismo pertenecientes a distintas especies, o en ambos 
casos a la vez, constituye una forma básica de generalidad que debe alcanzarse antes de poder 
llevar a cabo un análisis más refinado. 


Se debe hacer una distinción fundamental entre los métodos usados para evaluar la generalidad 
de un sujeto y los que se utilizan para evaluar la generalidad de una variable. La generalidad de un 
sujeto puede establecerse, al menos de un modo parcial, según el número de replicaciones 
llevadas a cabo con éxito entre distintos miembros de una especie dada. No existe, sin embargo, 
ningún método directo para evaluar la generalidad de una variable, puesto que cada experimento 
sucesivo que sirve para extender dicha generalidad es necesariamente distinto en algún aspecto 
de los que lo precedieron. En el caso del reforzamiento intermitente, por ejemplo, ¿es mayor la 
generalidad conseguida por medio de aquellos experimentos en los que se hizo variar el programa 
de reforzamiento o, por el contrario, en los que usaban técnicas de control aversivo? Nadie ha 


diseñado todavía una técnica estadística eficaz para da respuesta a esta pregunta. Por otra parte, 
tampoco se puede derivar, de modo riguroso, ninguna técnica de este tipo por medio de las reglas 
de la lógica. 


No existe, de hecho, criterio objetivo alguno, derivado de ninguna parte, que permita una 
respuesta inequívoca a esta pregunta, y del mismo modo puedo añadir que esto es igualmente 
cierto en lo que toca a la generalidad de un proceso, tema que trataré más adelante. Cuando la 
replicación es más sistemática que directa (ver Capítulos 3 y 4), los criterios de evaluación 
necesariamente involucran áreas de juicio que se hallan fuera del alcance de cualquier método 
conocido de cuantificación. Nos encontramos aquí, sólo que en miniatura, ante el problema por 
resolver del razonamiento inductivo. 


LA INDUCCIÓN Y LA EVALUACIÓN DE LA GENERALIDAD 


No tengo intención algún de acometer un tratado sobre la inducción, puesto que ello nos llevaría 
mucho más allá de lo que este libro pretende. Sin embargo, me he referido a la inducción 
previamente, al contrastarla con el método deductivo de teorizar (página 25), y voy a tener 
ocasión de mencionarla de nuevo, ya sea de un modo explícito o bien indirectamente en relación 
con el papel que juega la experiencia en la evaluación de datos. Citaré, por lo tanto, algunas 
palabras sobre la inducción, que he adaptado del fascinante librito de Polya, Induction and 
Analogy in Mathemathics.* 


Polya llega, creo yo, tan cerca del núcleo de la cuestión como nadie lo ha hecho, con una frase que 
describe la actitud inductiva. “Esta actitud aspira a adaptar nuestras creencias, del modo más 
eficiente posible, a nuestra experiencia ” (63, páginas 7). Si Polya estuviera familiarizado con el 
lenguaje empleado en el análisis de la conducta probablemente hubiera modificado ligeramente 
su frase, diciendo: “Nuestra conducta de inducción es función de nuestra historia de 
reforzamiento.” Y es que la inducción no es un proceso lógico, sino conductual, siendo ésta la 
razón por la que el análisis lógico ha fracasado en explicarla. El que hagamos una inferencia 
inductiva o no, así como el grado de tenacidad con que nos aferremos a ella, dependerá de 
nuestra historia conductual (experiencia). Me refiero también a esta historia cuando digo que la 
evaluación de la generalidad es un hecho de juicio, puesto que, partiendo de un acto de inducción 
basado en nuestra propia experiencia acumulada, juzgamos el grado de generalidad que podemos 
conferir a una variable determinada cuando se demuestra su eficacia en experimentos que poseen 
poca o ninguna relación operacional entre sí. 


Para evitar que el estudiante piense que he ido demasiado lejos al interpretar la frase de Polya 
sobre la inducción, permitaseme citar el siguiente fragmento, donde la última frase habla por sí 
misma: 


La experiencia modifica la conducta humana... 
Y, evidentemente, modifica también la conducta animal. 


En mi vecindario hay un perro raquítico que ladra y se echa encima de la gente sin ninguna provocación. 
Sin embargo, he descubierto que es bastante fácil protegerse de él. Si me agacho y simulo coger una piedra, 
el perro escapa corriendo y aullando. No todos os perros se comportan así, y es fácil adivinar qué tipo de 
experiencia proporcionó esta conducta al perro. 

El oso del zoo “implora comida”, es decir, que cuando un mirón se acerca a él, el animal adopta una 
postura ridícula que suele impulsar al mirón a arrojar un pedazo de azúcar dentro de la jaula. Los osos que 
no están en cautividad probablemente nunca asumen una postura tan absurda, y es también fácil imaginar 
qué tipo de experiencia condujo al oso del zoo a implorar comida. 

Una investigación a fondo de la inducción debería incluir, quizás, el estudio de la conducta animal (63, 
página 10). 


Al establecer la generalidad de una variable, de un proceso, de un método, etc. Estamos tratando 
de verificar nuestras observaciones iniciales dentro de un conjunto de condiciones cada vez más 
amplio. Polya ha sugerido un punto de referencia a partir del cual los científicos podrán evaluar el 
grado de verificación aportado por cualquier extensión dada de las condiciones originales. 
Su exposición está redactada en términos de verificación de una “ conjetura”, pero resulta 
fácil hacer las substituciones adecuadas: 


Los razonamientos que lleva a cabo el naturalista experto no son esencialmente distintos de los del hombre 
común, pero sin embargo son más completos. Tanto el científico como el hombre de la calle se ven 
obligados a hacer conjeturas a partir de unas pocas observaciones, y ambos prestan atención a casos que se 
presentan con posterioridad a la elaboración de una conjetura determinada y que pueden confirmarla o 
desmentirla. Un caso que concuerde con ella, hace que la conjetura sea más verosímil, a la vez que es 
desmentida por un caso que la contradiga, y es en este punto donde comienzan las diferencias. La gente en 
general tiene mejor disposición para buscar casos del primer tipo, mientras que, por el contrario, el 
científico trata de encontrarlos del segundo. La razón de ello es que todo el mundo tiene un poco de 
vanidad, tanto el hombre común como el científico, sólo que difieren entre sí en lo que les causa orgullo. Al 
hombre de la calle no le gusta confesar, ni tan sólo a sí mismo, que se había equivocado al hacer la 
conjetura, y es por ello que le disgustan los casos que la ponen en entredicho. Por lo tanto, los evita, e 
incluso se esfuerza en negar su existencia cuando se presentan. Por el contrario, el científico está lo 
suficientemente preparado como para reconocer una conjetura errónea, pero no soporta dejar los 
problemas por solucionar. Ahora bien, un caso favorable no resuelve definitivamente la cuestión, mientras 
que uno desfavorable sí lo hace. Es por ello que el científico, buscando una solución definitiva, va en pos de 
los casos que tienen una alta probabilidad de echar la conjetura por los suelos, de modo que cuanto más 
alta sea esta probabilidad, más los aprecia. Hay una observación a hacer en este punto, y es que si un caso 
que a primera vista amenaza con desmentir la conjetura, resulta, a fin de cuentas, confirmarla, la conjetura 
en cuestión sale extraordinariamente fortalecida de la prueba. Cuanto mayor es el peligro, mayor es el 
honor, y una vez superado con éxito el examen amenazador, queda garantizado el más alto reconocimiento, 
o sea, la más sólida evidencia experimental de aquella conjetura. Hay, sin embargo, casos y casos, 
verificaciones de un tipo y de otro. Una situación con mayor probabilidad de dar al traste con la conjetura, la 
coloca más cerca de su revalidación definitiva que un caso menos amenazador, lo cual explica la preferencia 
del científico... 

Un caso que no difiera substancialmente de otros examinados con anterioridad, si corrobora la conjetura 
reafirma, desde luego, nuestra confianza en ella, pero no en demasía. De hecho, creemos fácilmente, antes 
de efectuar la prueba, que el nuevo caso concluirá de igual manera que lo hicieron los anteriores de los 


cuales no difiere mucho. Deseamos, pues, no sólo otra verificación, sino una verificación de otro tipo... (63 
página 41). 


Si aplicamos este criterio a nuestro propio problema (página 65), podemos concluir que el 
experimento que trataba del estímulo de advertencia y el shock inevitable aporta el máximo de 
generalidad a la variable “intermitencia”, puesto que en él no sólo se altera el programa de 
reforzamiento temporalmente, sino también el tipo de reforzamiento (de comida a shock 
eléctrico) y, al convertir el shock en inevitable, eliminamos toda relación necesaria entre él y la 
conducta que medimos. Hay aquí una pista, quizás, de la existencia de un criterio objetivo para 
establecer el grado de diferencia entre dos casos y, por consiguiente, para evaluar asimismo el 
nivel de confirmación que cada uno aporta. Sin embargo, un simple recuento del número de 
diferencias de procedimiento no soluciona la papeleta, puesto que no se puede atribuir el mismo 
peso a todos los cambios debidos a diferencias de procedimiento al no tener todos los 
procedimientos la misma probabilidad de alterar los resultados de un experimento. El peso que 
asignemos a cada cambio de las condiciones experimentales dependerá tanto del saber general 
que exista en el área científica en cuestión como del conocimiento que un científico en particular 
haya llegado a poseer con respecto a ella. El grado de confianza que en una comunidad científica 
se otorgue a una inducción determinada estará, por consiguiente, en función de la extensión en 
que los miembros de dicha comunidad compartan una historia común de experiencia. 


GENERALIDAD DE UN PROCESO 


El término “proceso conductual” suele usarse por lo común en dos sentidos diferentes. Uno de 
ellos se refiere a la interacción de variables, de modo que cuando un número de variables u 
operaciones experimentales distintas interactúan aplicamos el término “proceso” a la conducta 
resultante. Por ejemplo, las operaciones de reforzamiento y extinción pueden combinarse de tal 
modo que den lugar a un proceso conductual que solemos denominar “discriminación”. Asimismo, 
pueden disponerse determinadas contingencias de reforzamiento de modo que distintas formas 
de conducta se combinen en un proceso que denominamos “dilación”. La identificación de tales 
procesos, en la medida en que son interacciones complejas de un cierto número de variables 
“elementales”, representa un avance en integración. Sin embargo, demostrar la generalidad de un 
proceso entre distintas especies es a veces difícil de conseguir, puesto que la misma complejidad 
de un proceso conductual oscurece la evaluación de todos los factores relevantes, tanto 
cuantitativos como cualitativos. 


El número de problemas aumenta cuando se intenta la replicación con una nueva especie. Debido 
a ello, el experimentador prudente no intentará demostrar siquiera la existencia de un proceso 
conductual en una nueva especie hasta que haya explorado concienzudamente sus distintos 
aspectos con los sujetos experimentales originales. Un intento fracasado es un despilfarro no sólo 
de tiempo y esfuerzo, sino también de datos útiles que se hubieran podido obtener en lugar de los 
conseguidos si se hubiera pospuesto el intento de generalización prematuro. El punto idóneo en 


que es aconsejable buscar la generalidad de un proceso entre especies, constituye un problema 
cuya solución dependerá de la experiencia del científico en particular y de la de otros colegas que 
trabajan en la misma área. 


La experiencia acumulada puede indicar que la generalidad de un proceso en un área concreta de 
investigación es relativamente fácil de conseguir, por lo que muchos experimentadores pueden 
preferir no intentar siquiera demostrar la generalidad de un proceso dado. En tal caso, puede 
traspasarse el problema a un estudiante que esté haciendo su doctorado, o incluso a los alumnos 
de un curso de laboratorio que no hayan obtenido aún su licenciatura. Es importante, a pesar de 
todo, que se lleven a cabo estos experimentos, aunque sólo sea para evitar que los que trabajan 
en un área determinada den por supuestas demasiadas cosas, a la vez que esta experimentación 
puede cumplir con la importante función de indicar la necesidad de realizar un estudio más 
detenido de fenómenos que se creían totalmente comprendidos. 


Por otra parte, la generalidad de un proceso puede ser considerablemente difícil de conseguir en 
otras áreas, en cuyo caso el experimentador deberá ser muy prudente en su programa de 
investigación. Debe señalarse, sin embargo, que la imposibilidad de demostrar la generalidad en 
otras especies no niega la posible importancia de un proceso conductual. La variabilidad, ya sea 
dentro de una especie o entre varias de ellas, no es fruto de la precocidad delos sujetos 
experimentales, sino de la ignorancia por parte del experimentador. 


La conducta del sujeto experimental está sujeta a leyes en relación con las variables que la 
controlan, y el fracaso al intentar replicar un hallazgo determinado dentro de una especie o en 
varias de ellas, es el resultado de una comprensión incompleta de las variables que rigen el 
proceso. Este enfoque positivo, en contraste con la actitud negativa que mantiene que el fracaso 
al intentar replicar un proceso implica su carencia de generalidad, constituye en realidad el único 
camino a seguir para llegar a una evaluación adecuada de la misma. La mayoría de los 
investigadores se lo piensan dos veces antes de declarar que un efecto determinado es “real”; sin 
embargo, esta prudencia científica no suele prevalecer cuando un experimento no consigue 
demostrar un fenómeno. Será conveniente señalar, por tanto, que una falsa negación de 
generalidad constituye un error tan costoso como una afirmación también falsa, dado que 
mientras que la aceptación de una afirmación falsa puede comprometer la utilidad del trabajo 
posterior, una falsa negación impide que se intente siquiera llevara a cabo mucho trabajo útil, y es 
posible que detenga el progreso durante largo tiempo. 


Existen ocasiones en las que pueden parecer triviales las demostraciones de la generalidad de un 
proceso. ¿Qué ganamos, por ejemplo, cuando se demuestra que el fenómeno conocido por 
“transposicion”88 es comuna hombres y monos? En realidad, cada vez que extrapolamos con éxito 
un proceso a otro organismo, es probable que llevemos a cabo algo más que la simple ampliación 
de un fenómeno restringido. Ello es particularmente cierto si el proceso en cuestión constituye 
solamente una parte de unas sistematización más amplia. En un caso así, la ampliación de un 
aspecto del sistema hace aumentar la probabilidad de que otros aspectos posean un grado de 
generalidad similar. Supongamos, por ejemplo, que un proceso que podríamos denominar 


“extinción discriminada” es observado en dos especies, A y B. La extinción discriminada es un 
término que se aplica a la disminución gradual observada en las respuestas de extinción a lo largo 
de una serie de experimentos alternativos de extinción y re-condicionamiento.* La confirmación 
de que este proceso particular se da en la especie B, ampliará nuestra confianza en la posibilidad 
de que sean también aplicables a esta especie B muchos principios relacionados con el 
condicionamiento y la extinción. 


La generalización satisfactoria de un proceso nunca requiere una replicación exacta de cada parte 
del sistema en que se incluye. ¿Cuántas demostraciones de generalidad individual requeriremos 
para aceptar la generalidad de un esquema total? No existe ninguna respuesta cuantitativa simple 
a esta pregunta. El número de demostraciones a efectuar dependerá de consideraciones tales 
como la complejidad de las generalizaciones que han resultado posibles y el grado de evidencia de 
las mismas, la reputación de los experimentadores que las han llevado a cabo, la magnitud de los 
efectos demostrados, la coherencia global del sistema y la especie particular en que se ha 
conseguido la generalización, así como otros juicios cualitativos en los que juega un papel 
determinante el grado de madurez de una ciencia y el de los científicos que a ella pertenecen. 


El segundo sentido con que se usa el término “proceso conductual”, se refiere en realidad al 
aspecto cuantitativo de la generalidad de una variable. Al determinar los efectos de un amplio 
intervalo de valores cuantitativos de una variable dada, el experimentador puede obtener una 
imagen más completa de su forma de actuación, que sea factible representar gráficamente 
mediante una curva que relacione cuantitativamente alguna medición conductual con diferentes 
valores de la variable experimental. Tal vez hallemos que la medición conductual crece 
linealmente a medida que la variable independiente aumenta su magnitud; o que la conducta, 
después de incrementarse, pasa por un máximo y luego decrece, o cualquier otra de las infinitas 
relaciones funcionales posibles. Frecuentemente, se suele calificar de procesos conductual a la 
relación funcional obtenida, puesto que nos indica los cambios operados en la conducta por las 
variaciones sistemáticas de uno, como mínimo, de los factores que la controlan. 


La generalidad puede investigarse, a partir de aquí, intentando replicar a función halada bajo 
nuevas condiciones experimentales o con otros organismos, o siguiendo los dos procedimientos a 
la vez. Cuando la función logra establecerse con varias especies distintas, podemos asegurar que 
disponemos de los fundamentos de una psicología diferencial científica, puesto que la cuestión 
que planteamos es si una variable determinada tiene una acción similar sobre la conducta de 
especies distintas. ¿Actúa la variable en cuestión del mismo modo en todo su intervalo de 
existencia? Tal vez encontremos, por ejemplo, que, en las ratas, la tasa de respuestas de evitación 
bajo ciertas condiciones está en función logarítmica del tiempo que cada respuesta de evitación 
pospone el shock (ver figura 27. Capítulo 8). Podemos entonces investigar la generalidad de la 
especie en cuestión, determinando si la función logarítmica también se mantiene en gatos, 
palomas, monos y seres humanos. Si realmente se mantiene, habremos conseguido algo más que 
la simple generalidad de una variable. Así pues, sabremos que no sólo la variable actúa en todas 
las especies que hemos observado, sino que además ejerce su efecto de un modo 
cuantitativamente similar a lo largo de todo su intervalo de existencia. 


Incluso en este caso, sin embargo, una respuesta negativa no puede aceptarse como definitiva. 
Por ejemplo, supongamos que usando un gato como sujeto experimental, observamos que la 
función es lineal en vez de logarítmica. Si esto ocurre, no debemos sacar del hecho conclusiones 
precipitadas. Todavía no sabemos si los responsables de esta diferencia son los cambios en otros 
parámetros de la función, de modo que la intensidad del shock sea decisiva, por ejemplo; o quizá 
hallemos que tanto en una especie como en otra la función se transforma gradualmente de 
logarítmica en lineal, a medida que vamos variando de modo sistemático la intensidad del shock. 
De esta manera, cambios en otras variables pueden dar lugar a que se obtengan similitudes allí 
donde en un principio sólo se habían hallado diferencias. Debido a ello, el experimentador debe 
abstenerse de buscar la generalidad de una especie de hasta que haya hallado primero la 
generalidad de un proceso bajo tantas y tan distintas situaciones experimentales como sea 
posible, dentro de la especie con la que lleva a cabo la investigación. Los intentos prematuros de 
demostrar generalidad de una especie pueden tener como consecuencia una pérdida de tiempo y 


esfuerzo, así como conducir a conclusiones equívocas. 


¿Qué grado de similitud se requiere en la replicación al evaluar la generalidad de una relación 
funcional? ¿Debemos aspirar a una replicación cuantitativamente exacta de una especie a otra, o 
de un conjunto de condiciones experimentales auxiliares a otro? La precisión que se pueda exigir 
al evaluar la generalidad de una relación funcional dada, dependerá del estadio de desarrollo en 
que se halle la ciencia. En algunos casos, podemos darnos por satisfechos si las distintas especies 
con que se experimenta muestran, pongamos por caso, una función creciente, 
independientemente de si es de tipo lineal, logarítmica, exponencial, etc. En otros casos podemos 
contentarnos con un parecido general en la forma de la relación funcional, descrita por la ecuación 
apropiada, aunque sin insistir en una correspondencia exacta entre las constantes de la ecuación. 
En psicología rara vez podemos exigir la replicación numérica exacta de una relación funcional, 
puesto que las técnicas de control experimental de que disponemos son inadecuadas para este 
grado de precisión. Asimismo, el grado de generalidad que podamos conseguir vendrá dado en 
gran parte por la precisión de nuestras técnicas experimentales. 


GENERALIDAD METODOLÓGICA 


Las demostraciones de la generalidad de determinadas técnicas experimentales de una especie a 
otra constituyen una forma de avance científico importante, y ello es particularmente cierto en lo 
que toca a las técnicas de control conductual. Tomemos, como ejemplo, el control de la conducta 
a través de la manipulación de programas de reforzamiento. Aunque queda aún mucho por 
aprender sobre las propiedades de estos programas, se ha conseguido un amplio grado de 
generalidad con respecto a sus efectos sobre la conducta de distintas especies, desde el pulpo al 
hombre. Una razón del por qué de la importancia de demostrar la generalidad de tales técnicas 
radica en el hecho de que no todas las especies son igualmente adecuadas para ser utilizadas 
como sujetos experimentales. Las técnicas de control experimental pueden y deben poseer un 
grado de rigor y precisión que sería inimaginable bajo el código ético en vigor si los sujetos 


experimentales fueran humanos. Así pues, aquellos investigadores cuyo interés final es la 
conducta humana, tienen dos caminos a seguir. En primer lugar, pueden emplear seres humanos 
en sus experimentos renunciando a sabiendas a un nivel de rigor y precisión considerable, con la 
esperanza de que las variables que manipulen sean lo suficientemente poderosas como para 
obtener datos significativos, o bien, por otra parte, pueden aspirar a un grado satisfactorio de 
control experimental utilizando animales en sus experimentos, con la esperanza también de que 
los datos que obtengan resulten más tarde generalizables a la especie humana, ya sea directa o 
indirectamente. 


Si se utiliza el segundo método, es de capital importancia demostrar la generalidad de una especie 
en lo que se refiere a as técnica de control. Cuando una técnica resulta aplicable a varias especies, 
tenemos más confianza en la generalidad de otras técnicas relacionadas con aquélla. Algunas 
técnicas, como por ejemplo los métodos de control aversivo, no son susceptibles de 
experimentación con sujetos humanos. Este problema no es exclusivo de la psicología y su 
solución debe buscarse en las otras ciencias que ya lo tienen resuelto, como ocurre en la 
farmacología. Las técnicas a experimentar deben aplicarse a una gran variedad de organismos 
inferiores, que se acerquen al hombre tanto como sea posible. Cuanto mayor sea el número de 
especies al que se pueda hacer extensiva una técnica determinada, mayor seguridad tendremos 
de que es aplicable a los seres humanos. Sin embargo, la extensión final a la conducta humana 
deberá provenir, no del método en sí mismo, sino de la información que se haya obtenido en su 
utilización con organismo inferiores, así como de aplicar los principios descubiertos con dicho 
método a la conducta humana, y de llevar a cabo con sujetos humanos, experimentos permisibles 
basados en una deducción lógica del trabajo previo. 


En ocasiones, una técnica de control resultará eficaz para manipular la conducta humana, aunque 
no para replicar los datos obtenidos con otras especies. Como ejemplo hipotético, un programa de 
reforzamiento de intervalo fijo puede dar lugar a una característica pauta temporal de respuestas 
en un sujeto humano, aunque puede ocurrir que esta pauta no sea exactamente idéntica a la que 
produce una paloma. El programa ejerce un control en ambos casos, aunque de distinto tipo. 
La primera tarea del experimentador será determinar, entonces, si otros parámetros distintos al 
que constituye la especie en sí pueden e ser los responsables de las diferencias observadas. 
¿Se podría conseguir, manipulando otras variables, que la conducta de la paloma tuviera la misma 
apariencia que la humana, y viceversa? Incluso si un intento en este sentido fracasara, la extensión 
de la técnica de control a la conducta humana continuaría siendo una aportación de gran interés, 
puesto que se habría abierto un nuevo camino para su estudio. E modo parecido, la aplicación de 
la técnica en cuestión a especies inferiores tampoco sería una pérdida de tiempo, dado que en 
este caso observaríamos una diferencia real, quizás importante, entre especies, lo que hubiera 
resultado imposible de evaluar correctamente sin el bagaje de información conseguido a través 
del estudio de organismos inferiores. 


Sección || 


Replicación 


A menudo se considera la ciencia como una metodología para la evaluación objetiva de los 
hechos, metodología suficientemente rigurosa que permite eliminar gran parte del error humano. 
Según esta definición, deberíamos a través del experimento, ser capaces de hallar respuestas 
inequívocas a todos los problemas naturales, tanto los de orden biológico como inanimado. 
En sus intentos de popularizarla, tanto los escritores profesionales como los científicos tienden a 
favorecer la impresión de infalibilidad de la ciencia, al menos dentro del dominio que les es 
propio. Las teorías pueden ser erróneas o inadecuadas —la destrucción por parte de Einstein de la 
física newtoniana es una fabula moderna-— pero se da por sentado que los hechos experimentales 
son incontrovertibles. 


El mito de que la ciencia es una disciplina dentro de la cual un hecho puede aceptarse como tal, 
independientemente de la opinión personal u otras consideraciones arbitrarias, es aceptado por 
muchos de los propios científicos. Evidentemente, los hechos son, por definición, inexpugnables. 
Sin embargo, un examen más detallado del método experimental tal y como se lleva a la práctica, 
conduce a preguntarse precisamente qué es, en realidad, un hecho. Para el observador imparcial 
resultará obvio que la ciencia se halla lejos de encontrarse libre del error humano, incluso en su 
evaluación de la evidencia factual. Los hallazgos experimentales, además, resultan de una gran 
fragilidad cuando son considerados dentro del marco global de fenómenos naturales del cual se 
extraen, y las conclusiones obtenidas a partir de esos datos resultan, con frecuencia, tan 
precarias, que no dejan de resultar sorprendentes los logros que alcanza la metodología 
experimental. Al efectuar un experimento cualquiera, ¿con qué debemos enfrentarnos? Debemos 
trabajar con variables como mínimo incontroladas, y muy a menudo, completamente 
desconocidas, con errores de selección de la información obtenida, surgidos de prejuicios tanto 
teóricos como de observación, con mediciones indirectas, con la teoría implicada en las propias 
técnicas de medición, con las suposiciones que cubren la laguna existente entre los datos y la 
interpretación. En pocas palabras, tenemos un margen de error tan amplio que cualquier avances 
real pudiera muy bien considerarse una casualidad si no fuera por el hecho de que ha habido 
muchisimos avances reales en demasiado poco tiempo para tomar en serio esta consideración. 


Los lógicos modernos intentan sistematizar las reglas de la evidencia científica, con el fin de 
formular su grado de adecuación en términos de probabilidad numérica. Hasta el momento no 
han tenido ningún éxito substancial, debido probablemente a que la práctica científica de 
evaluación de los hechos permanece a un nivel esencialmente pragmático. En la medida en que 
existan, las reglas de la evidencia se han ido desarrollando a partir de una larga historia de 
experiencia científica. Los criterios que utilizan los científicos varían desde consideraciones 
objetivas, tales como la precisión de los instrumentos de medida, hasta juicios marcadamente 
personales que atañen a la competencia del experimentador. Se ha dado mayor importancia a 
algunos tipos de evidencia que a otros; determinada muestra de evidencia puede considerarse 


más o menos adecuada en función de los interrogantes a que debe hacer frente el 
experimentador. En los dos capítulos siguientes se intenta describir algunos de los criterios 
evaluativos más importantes en función de su Uso real. 


La comprobación empírica más sólida de la fiabilidad de los datos la proporciona la replica ción, de 
la cual existen sin embargo varios tipos. De ellos, unos ofrecen más garantías que otros, o bien 
proporcionan algo más que una simple indicación de la fiabilidad. El valor adjudicado a técnicas 
específicas de replicación resulta, no de consideraciones lógicas a priori, sino de una tradición de 
eficacia cientifica, donde la experiencia y decisión del científico individual siempre están 
involucradas en la evaluación de datos. 


Il. Replicación directa 


La técnica de replicación más simple la constituye la repetición, efectuada por el mismo 
experimentador, de un experimento dado. La replicación directa puede llevarse a cabo, ya sea 
repitiendo el experimento con nuevos sujetos, o bien repitiendo las observaciones en los mismo 
sujetos, bajo diferentes condiciones experimentales. Según los datos se presenten como 
estadística de grupo o en términos dela conducta de sujetos individuales, denominaremos a la 
replicación efectuada con nuevos sujetos, replicación “entre grupos” o replicación “entre sujetos”, 
respectivamente. Cuando se repite el experimento con los sujetos originales, aplicamos los 
términos de replicación “intragrupo” o replicación “intrasujeto”. 


En los experimentos psicológicos que emplean poblaciones grandes y técnicas de datos 
agrupados, es raro llevar a cabo replicaciones. Ya señalé anteriormente que la replicación 
ayudaría indudablemente a establecer la fiabilidad de las medidas de tendencia central, pero que 
aportaría muy poco o nada para resolver la cuestión de la generalidad o representatividad con 
respecto a los individuos. Sin embargo, la replicación de los datos individuales puede permitir que 
se establezca de un modo directo tanto la fiabilidad como la generalidad de un fenómeno. 


REPLICACIÓN ENTRE SUJETOS 


Cuando un experimento se lleva a cabo con un solo organismos como sujeto, suele requerirse la 
replicación entre sujetos para eliminar el riesgo de que el organismo original pudiera haber sido 
una excepción. Sin embargo, existe también la posibilidad de creer, y de hecho hay quien está 
convencido de ello, que las excepciones no existen, y que todo dato cuidadosamente obtenido es 
un dato real, que de ningún modo puede descartarse. Si un experimento debe repetirse o no con 
otros sujetos, dependerá del juicio del investigador sobre la adecuación de las técnicas que 
emplee, así como de la confianza que tenga en la consistencia de sus datos, dentro de un cuerpo 
de conocimientos establecido. 


Si el investigador tiene alguna razón especial para sospechar que su técnica ha resultado 
defectuosa, o si emplea una nueva técnica con la que no está muy familiarizado, es más probable 
que decida emplear otros sujetos además del original. De modo parecido, si considera que sus 
descubrimientos difieren de otros datos conocidos, o si se halla en el caso, poco frecuente, de que 
sus datos parecen abrir un nuevo campo de investigación del cual se sabe poco o nada, 
probablemente juzgará convenientemente repetir el experimento. Sin embargo, en la medida en 
que las técnicas utilizadas se consideran fiables y adecuadas, nunca se repite un experimento con 
el único propósito de comprobar si los fenómenos observados son “reales”, admitiéndose sin más 
la realidad del descubrimiento original. El propósito de la replicación entre sujetos es determinar 
si variables desconocidas o incontroladas pueden resultar lo suficientemente poderosas para 
impedir una replicación con los mismos resultados. Si éste es el caso, el fracaso de la replicación 


entre sujetos debe servir de estimulo para una investigación más profunda y no para desechar los 
datos originales. Volveré a tratar este tema más adelante, así como en los capítulos dedicados a 
Variabilidad, puesto que sus implicaciones no parecen ser muy bien comprendidas entre la 
mayoría de los psicólogos. 


Los experimentadores que deciden si debe o no intentarse una replicación entre sujetos, 
basándose en su propia experiencia con las técnicas que utilizan y con un área de conocimiento 
determinada, deberán aceptar una consecuencia ineludible. Un investigador puede tener, 
basándose en su experiencia, una gran confianza en la eficacia de su metodología, pero no debe 
esperar que otros experimentadores la compartan sin acompañarla de evidencia convincente, que 
requiere mucho tiempo para que se acumule. Dicha evidencia consistirá en la replicabilidad 
demostrada de su trabajo por parte de otros experimentadores, y en la consistencia interna de sus 
descubrimientos comprobada por la replicación sistemática (ver Capitulo 4). 


Incluso la personalidad y carácter del experimentador serán tomadas en consideración por sus 
colegas y compañeros, de modo que si en una conversación informal aquél revela, por ejemplo, 
una ambición desmesuradas por conseguir un triunfo político dentro de su profesión, o bien serias 
deficiencias en su ética personal, sus productos científicos probablemente serán juzgados como 
resultado de sus actividades extracientíficas, requiriendo, por consiguiente, un grado de 
validación más severo que el normal. 


Como criterio de fiabilidad y generalidad, la replicación entre sujetos constituye una herramienta 
más poderosa que la replicación entre grupos, puesto que esta última solamente puede tomarse 
como indicador de fiabilidad en la medida en que demuestra que pueden repetirse los cambios 
observados en la tendencia central de un grupo determinado. Con respecto a la generalidad, la 
replicación entre grupos no contesta, a pesar de todo, la pregunta de a cuántos individuos 
representan los datos en realidad. Por otra parte, cada experimento adicional ejecutado dentro de 
una replicación entre sujetos aumenta la representatividad de los descubrimientos y, desde luego, 
la replicación llevada a cabo con dos sujetos proporciona mayor generalidad a los datos, entre los 
individuos de una población, que la replicación efectuada con dos grupos de sujetos, cuyos datos 
individuales aparecen combinados. 


En contraste con los experimentos que se llevan a cabo con grupos, cuya evaluación se realiza con 
métodos estadísticos y en los que rara vez se efectúa una replicación entre grupos, los 
experimentos realizados con sujetos individuales que utilizan más de un sujeto implican 
automáticamente una replicación entre sujetos, puesto que cada sujeto empleado constituye, 
como mínimo, un intento de replicación del experimento. En la investigación biológica, por 
ejemplo, es normal que se registre cada sujeto empleado como un experimento aparte, incluso 
cuando se han llevado a cabo exactamente las mismas operaciones en cada caso. 


¿En cuántos individuos debe replicarse un experimento antes de que se puedan considerar los 
datos obtenidos como representativos? Los psicólogos no han sometido esta cuestión al detenido 
análisis que su importancia requiere, debido principalmente al hecho de que, hasta hace poco 
tiempo, el número de investigaciones llevadas a cabo con sujetos individuales no era lo 


suficientemente grande como para ejercer un peso perceptible dentro de la masa de datos 
psicológicos que se publican cada año. Sólo ahora empieza a convertirse en un problema crítico. 
Un conjunto de factores concurrentes más importante surge de sutiles consideraciones, tanto 
cualitativas como cuantitativas, que se hacen al decidir cuántas replicaciones de un experimento 
dado son deseables. En este momento voy a indicar solamente algunos de los problemas 
generales con que debemos enfrentarnos en todo intento de desarrollar una "estadísticas de la 
replicación”. Una metodología tal debe adoptar la práctica científica como punto de partida, 
puesto que no se puede cuestionar la eficacia de dicha práctica, por más informales que puedan 
ser sus reglas. 


Empecemos considerando el ejemplo presentado en la figura 3. Será necesario describir el 
procedimiento experimental seguido con algún detenimiento, dado que, como veremos más 
adelante, los datos no pueden evaluarse adecuadamente tomando sólo números en 
consideración. 


PROMEDIO DE RESPUESTAS POR MINUTO 
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PORCENTAJE DE SHOCKS ADMINISTRADOS 


FIGURA 3. Conjunto de cinco curvas, cada una perteneciente a un distinto sujeto experimental, 
que ilustra la relación existente entre la masa de respuestas de evitación y el porcentaje de shocks 
administrados a los sujetos. (De Boren y Sidman, 13.) 


Estos datos provienen de un experimento sobre conducta de evitación, utilizando ratas como 
sujetos.” Al principio del experimento, el animal recibía un breve shock cada 20 segundos, pero 
que podía evitar, sin embargo, si apretaba una pequeña palanca, de modo que cada respuesta 
posponía el shock durante 20 segundos. Así, si apretaba la palanca con suficiente frecuencia, el 
animal posponía el shock indefinidamente. Aunque ninguna rata llega a comportarse 
óptimamente en este sentido, la mayor parte de ellas aprenden a apretar la palanca y a evitar la 
mayoría de shocks, llegando algunas a recibir menos de diez shocks a lo largo de una sesión 
experimental de seis horas de duración. En la curva perteneciente a la rata J-2, en la figura 3, el 


punto situado en el extremo izquierdo representa el promedio de tasa de respuestas a la palanca 
(unas 5.3 respuestas por minuto) emitidas bajo el procedimiento que acabo de describir. 


Puede considerarse éste como un procedimiento en el que el animal “merece” un shock cada vez 
que deja pasar 20 segundos sin apretar la palanca. Tal como lo hemos descrito, el sujeto recibe un 
shock cada vez que transcurren 20 segundos sin que haya emitido ninguna respuesta a la palanca, 
y en realidad el animal llega en general a “merecer”, y por lo tanto recibe, un uno por ciento de los 
shocks totales que hubiera recibido de haberse abstenido totalmente de apretar la palanca. Hasta 
aquí la primera parte del experimento. Se dedicó el resto del mismo a estudiar qué sucedería a la 
tasa de respuestas a la palanca s no se administraban algunos de los shocks que el animal 
“merecía” por no responder a tiempo. De este modo, se observó la tasa de respuestas de 
evitación de la rata J-2 cuando se administraba el 50 por ciento de los shocks “merecidos”. 
A continuación se siguió observando con un 30, 20, 10 y 5 por ciento, en este orden. Así por 
ejemplo, en el valor inferior, el animal recibía un shock sólo en un 5 por ciento de las ocasiones en 
que dejaba transcurrir más de 20 segundos sin apretar la palanca. 


Mientras se estaba llevando a cabo el experimento surgió el problema de decidir cuánto tiempo 
debía ser expuesto el animal a cada uno de los porcentajes de shocks administrados. Como 
investigación preliminar se decidió experimentar cada porcentaje en siete sesiones de seis horas 
de duración cada una. Se descartaban entonces las tres primeras sesiones por considerarselas 
como periodo de transición, tomándose la mediana de las tasa de respuesta promedio en las 
cuatro últimas sesiones en cada porcentaje de shock, como representativo del estado estable final 
para este valor. 


Examinemos ahora la curva que representa la conducta de la rata J-2. En un amplio intervalo de 
porcentajes de shocks, desde 100 a 30 por ciento, hay pocos cambios en la tasa de respuestas. 
A continuación, se observa un brusco descenso en dicha tasa, al baja el porcentaje de shocks del 
30 al 5 por ciento. Así pues, estos dos estados, o sea, la parte inicialmente horizontal de la curva 
seguida por el brusco descenso final en la tasa de respuestas, dan una idea general del resultado 
del experimento. Hay sin embargo mucho otros detalles, tales como el ligero aumento que se 
observa en la tasa correspondiente al porcentaje del 50 por ciento, la caída extremadamente 
brusca hasta casi cero que tiene lugar entre el 10 y 5 por ciento, y los valores numéricos 
correspondientes a cada uno de los puntos de la curva. Todos estos datos deben tomarse en 
combinación en el momento de decidir si es procedente intentar llevar a cabo una replicación 
entre sujetos. 


Una razón en contra de la replicación la constituye la ordenación global de los datos, puesto que 
habiéndose calculado seis puntos de la curva había una considerable probabilidad de que se 
manifestaran las posibles irregularidades, y sin embargo, los cambios parecen esencialmente 
continuados y totalmente incluidos dentro de los límites de variabilidad que la mayoría de 
investigadores suelen esperar en una investigación conductual. La regularidad de la curva 
también concuerda con otros trabajos llevado a cabo en el mismo laboratorio. Tales 
consideraciones conducen a un alto grado de confianza en la fiabilidad de los datos, u de hecho, si 


una replicación posterior con otros animales no confirmara las observaciones originales, nuestro 
paso inmediato no sería rechazar los datos obtenidos con la rata J-2, sino buscar 
experimentalmente las razones de las diferencias. 


Sin embargo, en el caso que nos ocupa había una razón de peso que aconsejaba la replicación de 
los datos obtenidos. La porción de curva de pendiente casi nula entre el 100 y el 30 por ciento no 
parecia concordar con los resultados de otros experimentos relacionados con el fenómeno que 
nos ocupa. Merece la pena que consideremos esta falta de concordancia detenidamente, puesto 
que deberemos tomar en consideración su naturaleza al determinar cuántas replicaciones serán 
necesarias. El hecho de que se observe una discrepancia con un descubrimiento previo bien 
establecido hace que los nuevos datos parezcan sospechosos, y que requieran un grado de 
confirmación más refinado del que sería necesario s se hubiesen observado discrepancias con 
datos ya de por sí poco consistentes. El especialista lógico o estadístico que desee cuantificar la 
adecuación de una replicación, debe encontrar algún sistema para traducir este criterio a 
números. Es decir, que cuando se acude a la replicación debido a divergencias observadas con 
descubrimientos previos, el grado de replicación que se requiera dependerá del grado en que 
dichos descubrimientos estén sólidamente establecidos. 


¿Cual es el problema que presenta la curva perteneciente a la rata J-2? Si consideramos en primer 
lugar el programa de administración de shocks de 100 por ciento, observamos que es posible 
especificar la duración del intervalo de tiempo que cada respuesta pospone el shock siguiente 
este intervalo, que es controlado por el investigador, es de 20 segundos. El retraso del shock que 
provoca cada respuesta que lo posponen han sido investigados con detalle en varias especies, con 
variaciones en el procedimiento básico e incluso con otros estímulos aversivos distintos del shock 
eléctrico. En general se ha descubierto que, con alguna salvedad de detalle, la tasa de respuesta 
es una función inversa del intervalo respuesta-shock (ver figura 27). A medida que aumentamos la 
duración del intervalo de tiempo que transcurre entre una respuesta y el próximo shock, 
disminuye la tasa con que dicha respuesta se emite. 


Examinemos ahora le programa de administración de shock del 50 por ciento, en términos del 
efecto que esta manipulación pueda tener sobre el intervalo entre respuesta y shock. 
Supongamos que se está llevando a cabo el experimento y que el animal acaba de apretar la 
palanca. Si los próximos 20 segundos transcurren sin ninguna respuesta a la palanca por parte del 
sujeto, éste recibirá un shock. Pero conforme al programa de administración de shocks del 50 por 
ciento, hay una probabilidad igual de que no tenga lugar ningún shock al final de los 20 segundos. 
En este caso, puede transcurrir un segundo periodo de 20 segundos de duración sin que el animal 
emita ninguna respuesta, y una vez transcurridos los 4o segundos sin que la rata haya apretado la 
palanca, vuelve a haber una probabilidad del 50 por ciento de que se administre el shock. (Nota: Al 
término de cada intervalo de 20 segundos sin respuestas por parte del sujeto, la probabilidad de 
que se administre el shock será o,5 sólo si la secuencia que sigue el aparato de programación de 
shocks es completamente aleatoria. Aunque en este experimento no se utilizó una secuencia 
aleatoria, el punto central de la argumentación permanece válido). Supongamos que el shock 
tiene lugar en este punto, de modo que habrán transcurrido 4o segundos entre el shock y la 


respuesta a la palanca inmediatamente anterior. Este equivale a haber doblado el intervalo 
respuesta-shock de 20 segundos que se cumplía estrictamente bajo el programa de 
administración de shocks del 100 por ciento. Basándose en descubrimientos anteriores, 
deberíamos esperar que se produjera una disminución correspondiente en la tasa de respuesta. 


Podemos llevar a cabo un análisis similar en el caso en que el programa de administración de 
shocks es del 30 por ciento. Aquí la probabilidad de que un shock tenga lugar después de 10 
segundos de no emitir ninguna respuesta es sólo 0,33- hay, pues, incluso una probabilidad mucho 
mayor de que el animal estará sometido en realidad a intervalos respuesta-shock mayores de 20 
segundos, y sin embargo los datos no parecen concordar con esta probabilidad. Nuestra 
generalización previa de que la tasa de respuesta está en función inversa de la duración del 
intervalo respuesta-shock no parece mantenerse en el caso de la rata J-22. A pesar de que hay 
intervalos respuesta-shock más largos, facilitados al parecer por los programas de administración 
de shocks del 30 y 50 por ciento, no se observa disminución alguna en la tasa de respuesta en este 
intervalo de la curva. El primer paso consistió, pues, en averiguar si los datos obtenidos con la rata 
J-2 eran reproducibles, o bien si resultaban de alguna variable desconocida sobre la que no se 
había establecido un control experimental adecuado. 


La magnitud e importancia de la divergencia entre los datos obtenidos por J-2 y los 
descubrimientos anteriores en lo que toca a los efectos del intervalo respuesta-shock justificaban 
una replicación inicial con cuatro nuevos animales. Pero, ¿cómo se llegó a establecer el número 
cuatro? Sería satisfactorio poder presentar una cadena de razonamiento lógico que condujera 
inevitablemente a la conclusión de que precisamente cuatro, ni uno más ni uno menos, fuera el 
número óptimo de sujetos requeridos en este caso para la replicación del experimento. 
En general, es más probable que encontremos las razones de esta elección en la historia de 
reforzamiento de los experimentadores, así como en el funcionamiento interno del laboratorio de 
que disponen. En nuestro caso, repetidamente habíamos tenido la experiencia en el laboratorio 
de que cuando cuatro animales (a menudo menos de cuatro) producían los mismos datos, toda 
experimentación subsiguiente muy rara vez fallaba en obtener resultados invariablemente 
buenos en la replicación. 


Hay aquí, pues, un segundo problema planteado al estudiante de lógica confirmatoria que esté 
interesado en cuantificar la evaluación de datos. ¿Cómo se pueden tomar en consideración los 
éxitos y fracasos que un experimentador ha tenido en el pasado? No parece haber ninguna 
justificación lógica de tales criterios, puesto que aparentemente no podemos saber qué influencia 
tienen las replicaciones con éxito de experimentos completamente distintos efectuados en el 
pasado, sobre la probabilidad de que un experimento actual resulte también replicable. 
La respuesta a esta cuestión es que ningún dato experimental es independiente del investigador, 
y que, asimismo, sus experimentos presentes y pasados tampoco son, en absoluto, 
independientes entre sí. El experimentador representa un hilo que une, correlacionándolos, todos 
sus experimentos, función que no depende de su presencia física o de su renombre profesional, 
sino de las técnicas de control experimental que utiliza. 


Si estas técnicas han demostrado ser adecuadas mediante replicaciones llevadas a cabo con éxito 
en el pasado, hay una gran probabilidad de que en experimentos subsiguientes las variables 
relevantes sean también sometidas a un control lo suficientemente riguroso como para poder 
aplicar los mismos criterios de replicación. Esta afirmación no es de tipo lógico, sino conductual. 
Es un principio empírico que se fundamente, y actúa, sobre la conducta de los científicos. 


El laboratorio no es el lugar adecuado para comportarse con una modestia excesiva. Del mismo 
modo que el científico cuidadoso no permitirá que su reputación suavice sus juicios sobre el grado 
de suficiencia de su propio trabajo, deberá igualmente encontrarse preparado para juzgar de un 
modo realista el grado de perfección con que lleva a cabo su experimentación. Si el grado de 
control conductual en sus experimentos es alto, debe reconocerlo así, y dejar que su trabajo siga 
directrices apropiadas. Dado que la ciencia es un asunto serio, un juicio demasiado modesto sobre 
la propia suficiencia experimental ante evidencia adversa, puede costar demasiado tiempo, 
energía y dinero en demostraciones innecesarias de competencia profesional. 


Aunque los científicos más capaces y escrupulosos están también sujetos a error, no es ésta una 
filosofía peligrosa, y en cuanto a aquéllos que supervaloran su propia competencia, tampoco 
pueden ignorar sus deficiencias por mucho tiempo. Otras técnicas de replicación, ya sean de tipo 
directo o bien sistemático, descubrirán pronto su falta de rigor. Este control se aplica también al 
científico probado que rara vez comete un error técnico. En realidad, no podemos aspirar a más. 


Volviendo a la figura 3, podemos observar los resultados de nuestros intentos de replicación. 
¿Se han replicado realmente los datos obtenidos con la rata J-2, o bien, por el contrario, existen 
discrepancias que será preciso solucionar antes de llegar a una conclusión? 


Es evidente que hay algunas discrepancias. Los valores absolutos de los puntos correspondientes 
a las cinco curvas muestran una pronunciada variabilidad de un animal a otro. No podemos decir, 
por ejemplo, que todas las ratas responden a una tasa de 5,5 respuestas por minuto cuando se 
administran sólo el 50 por ciento de los shocks. También podemos observar que algunas 
variaciones que muestran las curvas individuales no se mantienen de un animal a otro. El pequeño 
aumento que sufre el intervalo desde el 100 por ciento al 50 por ciento en la curva de la rata J-2, 
por ejemplo, no se mantiene en todas las curvas, aunque en algunas de ellas hay indicios de que 
ocurre un cambio similar a lo largo de un gran intervalo. A pesar de que indudablemente existe 
una razón para estos cambios, con posibilidad de ser descubierta, no se les prestó más atención 
no obstante su inconsistencia, puesto que una variabilidad de esta magnitud caía totalmente 
dentro de los límites que normalmente se observan y se toleran en este laboratorio. Los intentos 
encaminados a reducir esta variabilidad no se juzgaron económicos, dado que los cambios 
conductuales de más interés eran lo suficientemente significativos como para pasar por alto un 
grado de imprecisión tan pequeño en las líneas de base. Debe tenerse presente, de todos modos, 
que un trabajo posterior de investigación que controle mejor las variables puede demostrar que 
estas pequeñas variaciones son reales e importantes. 


Por el momento, y dentro de nuestros actuales límites tolerados de error experimental, no parece 
arriesgado llegar a la conclusión de que se ha replicado como mínimo un aspecto de los datos 


obtenidos con la rata J-2, debido a que en un amplio intervalo de variación del porcentaje de 
administración de shocks hay poco o ningún cambio en la tasa de respuestas de evitación. 
También parece haber quedado bien establecido un segundo aspecto de importancia: el descenso 
que se observa en un punto determinado es relativamente brusco, si comparamos el intervalo de 
variación del porcentaje dentro del que tiene lugar este descenso, con el intervalo en que se 
observa una pendiente practicamente constante. 


Algunos de los criterios en que los experimentadores basan su juicio sobre lo que constituye una 
buena replicación son de naturaleza más o menos estadística. La replicación llevada a cabo con 
cinco sujetos se comparó con otros intentos de replicación realizados en el pasado, que en general 
incluían un número más que suficiente para comprobar la realidad del fenómeno. La variabilidad 
resultante en este caso se comparó con la observada en otros experimentos, efectuados en éste y 
otros laboratorios, de modo que la magnitud del cambio observado en la tasa, correspondiente a 
los porcentajes bajos de administración de shocks, fue evaluada con referencia a una línea de 
base que contenía un cierto grado de variabilidad. En la medida en que es inevitable que estas 
comparaciones se lleven a cabo entre fenómenos que muestran un mayor o menor grado de 
variabilidad, se requerirá un juicio estadístico, por más implícito que sea. Sn embargo, los 
procesos estadísticos empleados no forman parte todavía de ningún libro de texto. 
La complejidad y sutileza de las consideraciones que implican hacen posible un juicio mucho más 
riguroso y exacto que el que permitiría cualquier procedimiento estadístico existente. 


En primer lugar, se toman en consideración datos procedentes de experimentos totalmente 
distintos, ya que el grado de solidez de otros datos relacionados constituye un factor de suma 
importancia. Además, una excepción aislada nunca resulta enterrada en una desviación estándar, 
sino que se evalúa con referencia a la adecuación de las técnicas de control. La cantidad y calidad 
de los datos inmediatos, así como de los descubrimientos más remotamente relacionados, son 
evaluadas, así como el grado de sistematización alcanzado por los segundos. 


Por carecer de significación respecto a hallazgos de mayor importancia, se hace caso omiso de 
algunos aspectos de los datos al evaluar el resultado de las replicaciones. En la figura 3, por 
ejemplo, los valores absolutos de las tasas pueden dejarse de lado al comparar las curvas en sus 
características más sobresalientes, tanto el largo intervalo en que la tasa permanece 
relativamente constante como el corto intervalo en que decrece, sugieren, al observarse este 
hecho en cada curva, con independencia del valor absoluto de la ordenada, que estas 
características de los datos son independientes de la tasa inicial. Algunas pruebas estadísticas que 
tomaran en consideración las diferencias en las tasa absolutas entre los animales, nos llevaría a la 
conclusión de que los datos obtenidos son demasiado variables para poderlas aceptar. En la 
práctica, sin embargo, la consistencia interna de las curvas individuales frente a las diferencias 
individuales en la tasa, sirve para aumentar su generalidad y fiabilidad. Toda demostración de que 
un fenómeno conductual es independiente de variables que sospechábamos podían influir en él, 
ayuda también a ampliar la fiabilidad y generalidad de dicho fenómeno, y la importancia que se 
otorgue a tal demostración no es, básicamente, un problema estadístico. 


El éxito de nuestro intento de replicación nos remite al problema que constituía la razón principal 
en la decisión primitiva de repetir el experimento: la discrepancia aparente entre éste y otros 
descubrimientos bien establecidos. Basándonos en los segundos, no teníamos por qué esperar la 
tasa constante observada a lo largo de un considerable intervalo. ¿Qué dirección hemos de tomar, 
a partir de este punto? ¿Deberemos, acaso, continuar replicando tanto éste como los 
experimentos anteriores hasta que se produzcan algunas excepciones? Una acción en este 
sentido sería contraria tanto a la estadística como la sentido común experimental. ¿Debemos 
pues intentar una evaluación cuantitativa rigurosa de los datos obtenidos en ambos conjuntos de 
experimentos y desechar entonces aquellos que parezcan tener menor fundamento? Tampoco 
muchos científicos defenderían una acción de esta naturaleza, puesto que la ciencia progresa a 
base de integrar, y no de desechar, los datos que parecen discrepantes. 


La tercera solución consistiría en desarrollar una teoría compatible con un conjunto de datos, e 
ignorar simplemente el otro, y es frecuente que dos piadosas argumentaciones acompañen este 
procedimiento. Una de ellas es la siguiente: "Naturalmente, modificaremos la teoría en cuanto 
nuevos datos así lo requieran”. Ello es no quererse enterar de que los nuevos datos en cuestión ya 
están disponibles. Otra excusa que se contradice a sí misma y que se arguye con más frecuencia 
es ésta: "Se necesita una teoría para desbancar a otra”. De este modo, muchos teóricos se 
inmunizan a sí mismos contra el desafío que representa cualquier dato contradictorio que se 
presenta sin ir acompañado de una teoría alternativa. Sin embargo, aquellos que no suscriben la 
teoría primitiva se hallan en una posición bastante incómoda hasta que las diferencias emplricas 
quedan resueltas. 


Un cuarto camino posible, incluso más elemental que la replicación directa, consiste en indagaren 
los factores que podrían explicar el por qué de las discrepancias y, por ende, eliminarlas. 
Una intentona de este tipo tal vez implique, de modo secundario, la formulación de una teoría 
puesto que se ha de empezar adivinando qué variables pueden ser las responsables, a pesar de 
que llamar “teorías” a estas conjeturas constituye un uso muy trivial de término. 


Sin embargo, no siempre es necesario conjeturar, ya que, de hecho, puede dar mejor resultado el 
proceso inverso. Una discrepancia aparente entre dos conjuntos de datos puede ser consecuencia 
de suposiciones teóricas implícitas y que no se reconocieron como tales. Éste, precisamente, fue 
el caso del experimento resumido en la figura 3, en que las discrepancias desaparecieron al 
desenmascarar un razonamiento teórico inexcusable, y al observar con más detenimiento algunas 
características también significativas de los datos, que no aparecen en la figura. He dicho ya, 
cuando describía el experimento, que la omisión de un porcentaje de shocks “merecidos” por el 
sujeto daba lugar a que se produjeran períodos mayores de 20 segundos entre una respuestas a la 
palanca y un shock, y, por otra parte, se sabía de antemano que al aumento de la longitud del 
intervalo respuesta-shock correspondía una reducción de la tasa de respuestas de evitación. 
El problema surgió, pues, porque no se observó ninguna disminución en la tasa de respuesta en 
los valores 50 y 30 del porcentaje de administración de shocks, a pesar de los intervalos respuesta - 
shock más largos que estos programas permitían. 


La deficiencia en el razonamiento original provenía de la suposición no declarada de que se daba 
como un hecho la mera posibilidad de que se produjeran intervalos de respuesta-shock más 
largos. Si tanto los hallazgos sobre el porcentaje de administración de shocks de la figura 3, como 
los datos anteriores acerca de la relación entre la tasa y los intervalos respuesta-shock son ciertos, 
la suposición unificadora más razonable sería precisamente la contraria, o sea, que a pesar de que 
eran posibles unos intervalos de respuesta-shock más largos, en realidad no se producían. Y si no 
tenían lugar, la constancia de la tasa a medida que disminuye el porcentaje de shocks es 
perfectamente compatible con el cuerpo de conocimientos ya existente. La plausibilidad de este 
enfoque es puesta de manifiesto si nos damos cuenta que, por el contrario, en las investiga ciones 
anteriores sobre este fenómeno, el experimentador tenía un control exclusivo sobre los intervalos 
de tiempo entre respuestas y shocks. 


No hay ya ninguna necesidad de entrar en más detalles. El examen posterior que se llevó a cabo 
de los intervalos de tiempo que separaban respuestas consecutivas indicó que los animales 
permitían muy pocas veces que dichos intervalos duraran más de 20 segundos, a pesar de la 
omisión de algunos de los shocks. Así pues, los datos obtenidos eran en realidad compatibles con 
los descubrimientos anteriores, desapareciendo con ello la razón más importante que nos 
impulsaba a dudar de su fiabilidad. Lo que quiero poner ahora de relieve es el hecho de que la 
reconciliación de aquellos datos con un cuerpo de información ya existente supuso una 
demostración de fiabilidad y generalidad mucho más satisfactoria que la replicación directa 
llevada a cabo con cuatro sujetos adicionales. Una demostración tal constituye, pues, otro tipo de 
replicación posible a la que me referiré de nuevo y con más detalle en el Capítulo 4. 


REPLICACIÓN INTRASUJETO 


La replicación intrasujeto, y, en menor grado, la replicación intragrupo, proporciona una 
demostración única de la fiabilidad de una técnica. Cuando la conducta de un organismo puede 
manipularse repetidas veces de un modo cuantitativamente consistente, el experimentador 
puede dar por sentado que se encuentra ante un fenómeno real, y que ha sometido las variables 
relevantes a un control eficaz. 


La figura 4 resume algunos datos obtenidos e un experimento” en el que algunas ratas, mediante 
la presión que ejercían sobre una palanca, hacían circular una breve corriente eléctrica hacia su 
cerebro a través de unos electrodos permanentemente implantados. El experimento investigó el 
efecto ejercido por dos niveles distintos de deprivación de agua sobre la tasa de respuestas a la 
palanca, con la que se obtenía el estimulo eléctrico intracraneal. En lugar de experimentar con dos 
grupos de animales, manteniendo cada uno de ellos a un nivel de deprivación distinto, los 
investigadores cambiaron alternativamente este nivel en cada sesión para un mismo y único 
animal. En los días de experimentación impares el animal no podía tomar agua desde 46 horas 
antes del comienzo de la sesión experimental, durante la cual podía apretar la palanca y 
autoestimularse el cerebro. En los días pares se permitía a la rata libre acceso al agua hasta el 
momento en que empezaba la sesión. La figura 4 muestra unos marcados cambios e la tasa de 


respuesta, que corresponden a los distintos niveles de deprivación de agua durante sesiones 
experimentales alternas. (La figura 4 también muestra una replicación entre sujetos.) 
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FIGURA 4. Curvas pertenecientes a dos sujetos mostrando las fluctuaciones que tienen lugar en la 
tasa de respuesta al aumentar y disminuir alternativamente el grado de deprivación de agua en 
sucesivas sesiones experimentales. (De Brady, Boren, Conrad y Sidman, 17.) 


Una manipulación experimental de este tipo es considerablemente más elegante que una 
demostración estadística de la acción de la variable experimental. Generalmente, aunque no 
siempre, los diseños estadísticos son armas de un solo tiro. Es decir, que se administra una sola 
vez cada valor de la variable independiente, y se evalúa la diferencia entre tratamientos 
contrastándola con una teoría que establece la probabilidad de que tal diferencia sea debida al 
azar. En una serie de manipulaciones experimentales llevadas a cabo en un solo sujeto, la posible 
influencia del azar disminuye considerablemente con cada replicación que tenga éxito. 


Algunos criterios estadísticos están implicados de modo implícito en estas replicaciones, aunque 
los especialistas en estadística no han desarrollado todavía ningún conjunto de reglas explícitas 
que abarquen este caso. El problema, planteado de un modo general, es el siguiente: ¿Cuántas 
replicaciones de un experimento se requieren, para obtener un nivel de confianza dado en la 
fiabilidad de los descubrimientos? Este problema es difícil de resolver para el estadístico, puesto 
que en primer lugar debe saber en qué consiste una replicación y si formula una pregunta en este 
sentido, probablemente se encontrará con que la respuesta que se le dé variará de un 
experimento a otro, puesto que los investigadores toman en consideración, en el momento de 
replicar un experimento, las magnitudes de los efectos observados, la confianza que les inspiran 
sus técnicas de control experimental, la coherencia de sus descubrimientos con datos 


relacionados ya existentes, la estabilidad y características de la línea de base que emplean, etc. 
La mayoría de los científicos hacen tales juicios de un modo intuitivo, sin darse cuenta de que 
continuamente están efectuando complejos cálculos en los que entra una avanzada, aunque 
todavía por formular, teoría de probabilidades. Tales evaluaciones casi forman parte de la misma 
naturaleza de los científicos, dado que, de un modo informal las llevan a cabo sin parar, 
conjuntamente con sus actividades diarias de planificación de nuevos experimentos, 
comprobación del curso que siguen, cambios de dirección en la investigación, e interpretación de 
resultados. 


Una vez que ha quedado bien establecido, para un caso dado en qué consiste una replicación, 
debe decidirse cuántas replicaciones se requerirán. Esta decisión variará de un campo de estudio a 
otro, y de experimento a experimento. En ocasiones bastará con una sola replicación, mientras 
que e otras serán necesarias dos o más. Puede llegar un momento en que el experimentador 
juzgue más provechoso empezar con un experimento nuevo que seguir repitiendo el antiguo. 
Si ha planeado efectuar una serie de experimentos dentro de un área determinada o s ya se han 
llevado a cabo todos ellos, probablemente el número de replicaciones directas sea pequeño, 
puesto que en un caso así tendrá más confianza en la replicación sistemática (ver Capítulo 4). 
Por ejemplo, en el experimento representado en la figura 4, se consideró innecesario efectuar 
más replicaciones intrasujeto porque también se había realizado una replicación entre sujetos; la 
replicación entre especies, había tenido éxito y también se había llevado a cabo replicaciones 
utilizando otros programas de reforzamiento empleados para generar las líneas de base, y un 
método distinto de alteración de los niveles de deprivación. 


La replicación intrasujeto muestra una característica, a la vez poderosa y elegante, que es 
imposible de conseguir con un arma estadística de un solo tiro: la facilidad con que se puede 
ejercer, a voluntad, control experimental a lo largo del tiempo. La figura 4 proporciona un 
excelente ejemplo de ello. Aunque podría haberse dibujado de in modo distinto, con un trazo que 
uniera los puntos superiores correspondientes a 46 horas de deprivación y otro trazo que 
conectase los puntos inferiores, correspondientes a cero horas de deprivación; sin embargo, se 
escogió el método de unir con un único trazo, los puntos que se sucedían en el tiempo, dado que 
pone de relieve las sucesivas reversiones en la tasa de respuesta, en función del nivel de 
deprivación de agua. La alternación de la tasa en concordancia con un esquema temporal 
determinado por el experimentador aumenta nuestra confianza en la realidad del efecto 
observado. De este modo, la imposición de una liberada pauta de cambio en la tasa de respuesta 
eliminó la posibilidad de que el paso del tiempo fuera una variable relevante por sí misma. 
Una demostración de control tal, relativamente independiente del transcurso del tiempo en el 
experimento, hace que sea posible reducir el número de replicaciones requeridas para establecer 
firmemente el efecto observado. 


La replicación intrasujeto también posee la clara virtud de eliminar la variabilidad entre sujetos 
como factor que puede incidir en la evaluación de un hallazgo experimental, puesto que los 
procedimientos estadísticos utilizados en el estudio de grupos suelen operar sobre una línea de 
base de variabilidad entre sujetos. Si, por ejemplo, la diferencia entre dos tratamientos 


experimentales es menor que la variabilidad entre sujetos entre los dos grupos que se han 
empleado para ello, la diferencia no se considera “significativa”. Por el contrario, la replicación 
intrasujeto está libre de esta fuente de error, puesto que opera sobre una línea de base de 
variabilidad intrasujeto únicamente. Como técnica práctica, la replicación intrasujeto es sólo 
posible cuando la línea de base conductual a partir de la cual se miden los cambios ha alcanzado 
un estado estable y permite cambios reversibles, o bien si, al cambiar irreversiblemente, lo hace 
de un modo conocido y previsible. 
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FIGURA 5. Registro acumulativo de la conducta de apretar la palanca de un mono, observándose 
un claro rompimiento de la línea de base de conducta en curso debido a un estímulo que precede 
a un shock no evitable. Después del shock el animal vuelve a su comportamiento normal. 


La figura 5 ofrece un ejemplo de una línea de base conductual relativamente estable, de modo 
que las variaciones que sufre constituyen las medidas de la efectividad de una variable dada. 
La conducta de un mono de apretar la palanca se mantenía debido a que, ocasionalmente, el 
experimentador dejaba que una respuesta a la palanca produjera un reforzamiento con comida 
(programa de reforzamiento de intervalo variable). Las respuestas se acumulan en las ordenadas, 
y el paso del tiempo se representa en las abscisas, de modo que la pendiente de la curva así 
obtenida expresa la tasa de respuestas a la palanca (respuestas por minuto). La tasa de respuestas 


relativamente constante que normalmente genera el programa de reforzamiento de intervalo 
variable da lugar a una estupenda línea de base con vistas a la observación de un cambio 
conductual, tal como el que corresponde a la porción de pendiente nula en la curva de la figura 5. 
Allí donde incide la primera flecha se presentó un estimulo auditivo al animal (una serie de rápidos 
“clics”). Este estimulo duró cinco minutos y terminó con la administración de un breve shock 
eléctrico inevitable, aplicado a los pies del mono. La segunda flecha señala el punto en que el 
sujeto recibió el shock. Después de aplicar varias veces la combinación estimulo -shock al animal, 
éste mostró una profunda alteración conductual en presencia del estímulo. Su conducta en curso 
quedó totalmente alterada, de modo que la conducta de apretar la palanca se vio reemplazada 
por una intensa y agitada actividad locomotriz, alternando con periodos de completa inmovilidad. 


En la figura 5 se puede observar claramente la interrupción de la conducta de apretar la palanca 
durante el intervalo de cinco minutos en que estuvo presente el estímulo. La estabilidad de la 
línea de base, tanto antes del comienzo del estimulo como después de su terminación, 
proporciona clara evidencia de que los cinco minutos de supresión de respuestas están, a no 
dudar, en correlación con la presencia del estímulo. 


Sin embargo, la replicación intrasujeto hace que el fenómeno sea aún más convincente. En la 
figura 6, donde está representada la conducta de otro mono, el estímulo se presenta durante 
períodos de cinco minutos alternados. La sesión empieza con un reforzamiento intermitente de la 
respuesta de apretar la palanca, bajo un programa de intervalo variable. Después de cinco 
minutos comienzan los “clics”, indicándose en la figura 6 por un ligero desplazamiento del trazo 
hacia abajo junto a la abreviación "cl.”. Dicho estímulo se presenta durante cinco minutos, al cabo 
de los cuales termina con la administración de un breve shock inevitable a los pies del animal. 
El primer shock está indicado mediante un ligero movimiento de la plumilla del aparato 
registrador hacia arriba, junto con la abreviación “sh.”. A continuación el ciclo empieza de nuevo, 
alternándose cinco minutos sin estímulo con cinco minutos en los que está presente. 
Invariablemente, se administra un shock al final de cada estímulo. 


Podemos ver en la figura 6 que una supresión de la tasa de respuesta acompañada a cada periodo 
de presentación del estimulo, mientras que la línea de base se recupera durante los períodos en 
que no hay “clics”. Hay pues, en total, nueve replicaciones de la supresión conductual a lo largo de 
una hora y media. Tanto el número de replicaciones, como la secuencia temporal de cambios 
conductuales controlada de un modo tan preciso, no dejan lugar a dudas de que el efecto del 
estimulo es genuino. Simplemente, el carácter directo de la demostración conseguido gracias a la 
estabilidad de la línea de base conductual es una característica de la replicación intrasujeto que 
cae dentro de la mejor tradición en metodología científica. Ninguna demostración estadística de 
un efecto similar, promediado sobre un grupo de sujetos, sería tan convincente. 
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FIGURA 6. Nueve replicaciones intrasujeto, efectuadas a lo largo de una sola sesión experimental, 
del cambio conductual ilustrado en la Figura 5. 


Otra consecuencia de la estabilidad de la línea de base, combinada con el control repetitivo que 
caracteriza la replicación intrasujeto, es la demostración fiable de la existencia de efectos 
menores, que resultaría imposible de llevar a cabo de otro modo. Un efecto secundario obtenido 
en el marco de un experimento llevado a cabo con un grupo, probablemente quedará 
enmascarado por la variabilidad entre sujetos. Es indudable que, cuanto mayor sea la estabilidad 
de la línea de base individual que podamos conseguir, será menor el riesgo de que despreciemos, 
o simplemente nos pasen inadvertidos, estos efectos secundarios y sin embargo reales. Tales 
efectos son, en sí mismos, siempre sospechosos, debido a la constante posibilidad de que sean 
producto de algún factor incontrolado que ha escapado al experimentador. Sin embargo, si se 
observan con regularidad, como resultado de administrar repetidamente una variable a un solo 
sujeto, y si la estabilidad de la línea de base sugiere que, en general, halla en una situación muy 
propicia para intentar descubrir los factores significativos que hacen crecer la magnitud del 
efecto. Es de esta manera que podemos conseguir un mejor dominio experimental con el que 
delimitar una observación determinada de un modo más preciso, amarrándola firmemente a un 
contexto sistemático. 


Las líneas de base estables que deben utilizarse como punto de partida para la replicación 
intrasujeto no implican necesariamente constancia ni tan sólo simplicidad, pudiéndose dar el caso 
de que una buen línea de base esté cambiando continuamente y del modo más complejo que se 
pueda maginar. Sin embargo, si estos cambios siguen un orden y son a su vez replicables, su 
utilidad como línea de base no disminuye en absoluto. La figura 7 ilustra la ingeniosa utilización de 
una línea de base compleja. El sujeto de este experimento”* era una paloma hambrienta a la que 
se había enseñado a picar sobre un disco luminoso colocado en una pared del recinto 
experimental. Una vez aprendida dicha conducta de picar sobre el disco, fue puesta bajo el control 
de un estimulo múltiple (ver Capítulo 11). Cuando el disco aparecia de color azul, debían 
transcurrir 15 minutos antes de que una respuesta al disco por parte del sujeto provocara una 
elevación del comedero de grano que normalmente se encontraba por debajo del nivel del suelo 
de la jaula, colocándolo así al alcance de la paloma. De este modo, la conducta en presencia de la 


luz azul pronto adquirió las características temporales que normalmente se observan en el 
programa de reforzamiento de intervalo fijo, representado por la curva superior del apartado D de 
la figura 7. Durante los breves minutos que siguen inmediatamente a la aparición de la luz azul, no 
se emite la conducta de picar sobre el disco. Sin embargo, a medida que se acerca el término del 
intervalo de 15 minutos, el sujeto empieza a responder cada vez con más frecuencias hasta 
alcanzar una alta tasa terminal, de modo que el registro acumulativo muestra una curvatura 
característica de este programa de reforzamiento. 
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FIGURA 7. Registro acumulativos que ilustran el uso de una estable, aunque compleja, línea de 
base de conducta para seguir el curso temporal de la acción de fármacos. Las curvas situadas a la 
mitad superior de la figura muestran una conducta de bajo u programa de intervalo fijo, casi 
destruida por la droga al principio, y luego recuperándose gradualmente hasta recobrar sus 
características normales. Las curvas de la mitad inferior muestran los cambios iniciales de corta 
duración que tienen lugar simultáneamente en una conducta sometida a un programa de razón 
fija. (De Dews, 24.) 


En esta línea de base ya de por sí compleja se introdujo una complicación adicional. Al cambiar el 
color del disco de azul a rojo, el comedero se ponía a disposición del pájaro cuando éste había 
picado 60 veces sobre el disco, o sea que entraba en vigor un programa de reforzamiento de 60 
respuestas en presencia de la luz roja. La conducta controlada por la luz roja mostró una alta tasa, 
característica de este programa de reforzamiento y muy diferente de la conducta emitida en 
presencia de la luz azul (ver la curva inferior del apartado D, figura 7). 


Así pues, tenemos una línea de base conductual en que dos esquemas de conducta se ponen a 
nuestra disposición simplemente cambiando el color del disco. Esta conducta, que no es ni 
constante ni simple, no sólo cambia según la iluminación del disco sino que también varía 


sistemáticamente con el transcurso del tiempo en presencia de la luz azul. Sin embargo, y a pesar 
de su complejidad, es ordenada y reproducible, y su utilidad queda totalmente demostrada 
cuando se utiliza para estudiar los efectos conductuales del fenobarbital sódico. La figura 7 
muestra de un modo escalonado los efectos de este fármaco a lo largo del tiempo, con referencia 
a Cada uno de los componentes de la línea de base. La primera acción de la droga que se observa 
es la de borrar completamente la conducta de intervalo fijo y de distorsionar el curso continuado 
de la conducta de razón fija (apartado A de la figura 7). En su segundo estadio (apartado B) vuelve 
a aparecer la conducta de intervalo fijo, aunque sin su aceleración característica. En este punto la 
conducta de razón fija vuelve a ser esencialmente normal. A continuación la conducta de intervalo 
fijo se recupera parcialmente (apartado C), y, finalmente, ambos componentes de la línea de base 
vuelven a mostrar el aspecto que ofrecían antes de que se administrara la droga (apartado D). 


En este experimento, el uso de una línea de base compleja hizo posible un análisis diferencial 
sumamente detallado de la acción del fenobarbital sódico. La regularidad controlada, así como la 
capacidad de la línea de base para volver a su punto de partida después de que se desvanecen los 
efectos de la droga, posibilita una replicación intrasujeto de dichos efectos. La complejidad por sí 
misma no constituye, pues, ningún obstáculo con vistas a la replicación intrasujeto. 


Ocurre a menudo, especialmente en una ciencia joven, que un experimento se lleve a cabo con el 
Único propósito de determinar si es posible obtener un efecto dado. En un experimento de este 
tipo, todo lo que es necesario es la demostración de la existencia del fenómeno en cuestión en un 
solo organismo, estableciendo su fiabilidad mediante la replicación intrasujeto. La importancia 
que le confiera el experimentador decidirá el grado de esfuerzo a dedicar a los intentos de 
establecer la generalidad del efecto. Habiendo demostrado que una variable dada puede producir 
un efecto determinado, el principal interés en dicha variable es posible que radique Únicamente 
en su eliminación de experimentos futuros. Sin embargo, si la importancia de la variable en 
cuestión descansa en su valor informativo más que perturbador, el científico tratará de 
determinar su generalidad. 


No obstante, es importante resaltar que un fracaso al intentar una replicación en todos los 
posibles sujetos, no relega el hallazgo al limbo del “azar”. Cada vez que observemos que la 
manipulación repetida de una variable produce cambios conductuales regulares en un solo 
organismo, la imposibilidad de conseguir una replicación consistente entre sujetos simplemente 
indicará la necesidad de proseguir con una investigación funcional más intensiva. Los estudios 
paramétricos de la variable en cuestión, combinados con la manipulación de otros factores 
concurrentes, a menudo revelarán la existencia de factores cuantitativos bajo los cuales todos los 
sujetos muestran formas de conducta similares. La manipulación sistemática de variables, como 
técnica para establecer tanto la fiabilidad como la generalidad de un fenómeno dado, se tratará 
con más detenimiento en capítulos posteriores. 


Este modo de enfocar los fracasos en los intentos de replicación complica el problema que se 
plantea al lógico que busca una expresión matemática del éxito en la replicación, dado que se verá 
forzado a sopesar de algún modo los éxitos y fracasos si quiere llegar a establecer una proposición 


de probabilidad que exprese el grado de confianza con que podemos aceptar el descubrimiento 
en cuestión. 


Los éxitos de replicación, sin embargo, nunca podrán ser equilibrados por un número de fracasos, 
por grandes que éstos sean. En el caso de que se obtengan éxitos y fracasos a partes más o menos 
iguales al replicar un fenómeno, sólo quedan dos posibles caminos a seguir, que distan mucho de 
abandonar el problema por completo. Uno de ellos consiste en demostrar que las replicaciones 
que obtuvieron éxito fueron resultado de determinada manipulación o aparato experimental. 
El segundo, de modo parecido, consiste también en demostrar que las replicaciones fracasadas 
pueden evitarse y obtener éxitos en su lugar, mediante la identificación y el control experimental 
de las variables que actúan sobre el fenómeno en cuestión. No existe, pues, término medio: un 
descubrimiento es genuino o no lo es, y determinar las condiciones en que debemos aplicar un 
juicio u otro constituye un problema experimental, no estadístico o lógico puesto que un proceso 
natural existe independientemente de nuestro grado de confianza en su realidad. Es éste un 
punto importante, y el estudiante no deberá dejarse llevar a engaño por la moderna filosofía 
científica que defiende que la verdad es sólo un fenómeno estadístico. Desde luego, sabemos por 
experiencia que en la evaluación de una teoría llegarán, en un momento dado, nuevos datos que 
demostrarán la insuficiencia de la misma. Por lo tanto, debemos considerar nuestra aceptación de 
una formulación teórica de un modo algo probabilista. También los datos pueden ser verdaderos 
dentro de ciertos límites de probabilidad, pero estos limites vienen impuestos por nuestros 
errores de medición, y siempre existe un grado de precisión más allá del cual la exactitud de las 
mediciones va siendo cada vez más dudosa. Sin embargo, antes de alcanzar esta línea divisoria, la 
verdad o falsedad de un dato no puede llevarnos a engaño, y si un investigador fracasa en sus 
intentos de replicación de un dato determinado, no puede tranquilizar su conciencia con la 
racionalización de que vivimos, después de todo, en un mundo probabilístico, donde la verdad es 
un asunto relativo. La única conclusión que puede deducir de la variabilidad es que las técnicas de 
control que utiliza son inadecuadas. 


Algunos de los problemas de más difícil análisis en una ciencia de la conducta surgen cuando se 
consigue con pleno éxito una replicación entre sujetos, mientras que fracasa repetidamente la 
replicación intrasujeto. De entre varios factores, cualquiera de ellos puede ser el causante de esta 
situación, aunque todos se reducen en último término a la imposibilidad de restituir la línea de 
base del sujeto a su punto de partida. Éste no es, necesariamente, un problema grave. Si la línea 
de base cambia en función del tiempo, independientemente de la operación experimental que se 
le impone, este cambio debe tomarse en consideración al evaluar la replicación, sin que ello 
presuponga una complejidad insuperable. No conozco ningún caso en el que se haya empleado 
esta técnica, pero su utilidad potencial parece ser lo suficientemente prometedora, con vistas a 
solucionar algunos de los problemas de replicación más persistentes con que se enfrenta el 
psicólogo, como para exponer detalladamente el siguiente ejemplo, aunque sólo sea hipotético. 


Un tradicional y problemático campo de interés para muchos psicólogos lo ha constituido el modo 
en que un cierto número de variables influyen sobre la resistencia conductual a la extinción. 
Cuando se interrumpe el reforzamiento de una conducta determinada, el organismo la continuará 


emitiendo durante un período de tiempo limitado a pesar de que ya no incida ningún 
reforzamiento sobre ella. El procedimiento consistente en retirar el reforzamiento de una 
respuesta previamente condicionada se ha denominado “extinción experimental”. Cuanto más 
tiempo continúe emitiéndose una respuesta en ausencia de reforzamiento, mayor es su 
“resistencia a la extinción”. 


Han sido problemas de particular interés los efectos que, sobre la resistencia a la extinción, 
ejercen variables tales como el número de reforzamientos que la conducta ha recibido 
previamente, el programa de reforzamiento bajo el que se la condicionó o mantuvo, el nivel de 
deprivación al que estaba sometido el organismo tanto durante el condicionamiento como en la 
extinción, etc. Examinemos ahora esta cuestión más de cerca, prestando especial atención a los 
problemas que presenta con vistas a la replicación intrasujeto. Podemos simplificar el caso 
dejando de lado algunos de los factores más sutiles que lo complican, y considerar tan solo los 
efectos que dos niveles de deprivación ejercen sobre la resistencia a la extinción. 


Sería ingenuo considerar que el experimento puede llevar se cabo de la siguiente manera: en 
primer lugar, condicionar la respuesta mediante la administración al sujeto de un elevado número 
de reforzamientos con comida. A continuación, extinguir la conducta así adquirida después de 
haber deprivado al sujeto de comida durante, por ejemplo, 48 horas y registrar todas las 
respuestas de extinción que se emitan, acto seguido, volver a condicionar la misma respuesta con 
un número igual de reforzamientos y extinguirla de nueva, esta vez después de haber deprivado al 
sujeto durante 12 horas. Luego comparar el número de respuestas emitidas durante los dos 
periodos de extinción experimental para determinar de qué modo la resistencia a la extinción se 
ve afectada por el estado de deprivación del organismo en aquel momento. A continuación, 
replicar el experimento con el mismo sujeto, tal vez invirtiendo el orden en que se le sometera a 
los dos niveles de deprivación. 


Desgraciadamente, el problema no puede resolverse de un modo tan sencillo. El procedimiento 
que acabo de describir se basa en el supuesto de que la línea de base de extinción se mantiene 
constante. Dicho de un modo más específico: que si se expusiera el sujeto repetidamente a ciclos 
que alternaran el reforzamiento y la extinción a un nivel constante de deprivación de comida, la 
resistencia a la extinción también se mantendría constante de uno a otro ciclo. En realidad, este 
supuesto no es válido, puesto que el número de respuestas de extinción decrece cada vez que se 
expone el organismo al procedimiento de extinción, aunque se recondicione la respuesta entre 
extinciones consecutivas. Así, en nuestro experimento original tal como lo describimos más 
arriba, no podemos asegurar que una resistencia a la extinción menor bajo 12 horas de 
deprivación que bajo 24 horas esté correlacionada con el nivel de deprivación. Es probable que en 
el segundo período de extinción se hubiera emitido un número menor de respuestas a pesar de no 
haberse variado el nivel de deprivación. Cualquier replicación intrasujeto posterior del 
experimento se vería contaminada por el cambio constante que sufre la línea de base de 
extinción. 


Sin embargo, si la resistencia a la extinción vería de un modo regular, puede sacarse partido de 
esta regularidad, tanto en favor del experimento original como de las replicaciones intrasujeto 
posteriores. Dado que no se ha publicado ninguna investigación en la que este problema se haya 
atacado a un nivel de rigor experimental lo suficientemente satisfactorio como para revelar el tipo 
de regularidad a que está sometido el sujeto, he inventado los datos que aparecen en la figura 8, 
apartado A. Se trata, pues, de una representación hipotética del número de respuestas emitidas 
por un sujeto individual en sucesivas sesiones de extinción, separadas una de otra por una sesión 
de re-condicionamiento y llevadas a cabo bajo un nivel de deprivación de comida constante a 
todo lo largo del experimento. Co vistas a la simplicidad de exposición he representado una 
función lineal. El primer paso para atacar el problema de la extinción referido al nivel de 


deprivación sería determinar la forma que tomaría esta curva en un número dado de sujetos 
experimentales individuales. 
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FIGURA 8. Replicación intrasujeto confrontada con una línea de base variable. La curva A 
representa datos hipotéticos de un experimento en el que se condicionó y extinguió 
alternativamente una respuesta, a un nivel de deprivación de comida constante de 48 horas. Esta 
curva se utiliza luego en B como línea de base, a partir de la cual se evalúan los cambios 
conductables resultantes de una disminución de 12 horas del nivel de deprivación. 


Si tratamos con un proceso conductual consistente, y si tenemos suficiente control sobre las 
variables que lo regulan, es probable que obtengamos una curva similar para cada sujeto, quizá 
con diferencias en la pendiente y puntos de intersección con los ejes. Una vez que estemos 
convencidos de que obtendríamos la misma función para cada posible sujeto dentro de estrechos 


límites de variabilidad intrasujeto, podemos empezar con nuestro objetivo principal, o sea, la 
manipulación de niveles de deprivación. 


Tomemos ahora un sujeto experimentalmente virgen y determinemos sólo los dos primeros 
puntos de su curva de extinción a un nivel de deprivación de 48 horas. Una vez determinados los 
dos primeros puntos podremos trazar el resto de la curva, puesto que se sabe que es una función 
lineal gracias al experimento previo. Esto es lo que se ha hecho, hipotéticamente, en el apartado 


B de la figura 8. La parte de la curva dibujada a trazos es la extrapolación de las dos 
determinaciones empíricas de los primeros puntos efectuados a un nivel de deprivación de 48 
horas- llevemos a cabo ahora el tercer período de extinción después de haber recondicionado el 
sujeto al nivel original de 48 horas de deprivación, aunque lo deprivaremos durante sólo 12 horas 
para la extinción. El número de respuestas durante esta sesión de extinción está representado por 
el primer punto correspondiente a 12 horas de la figura 8, apartado B. se observó que la 
disminución del número de respuestas de extinción es considerablemente más acusada que la que 
hubiera mantenido a 48 horas. Si el primer punto correspondiente a 2 horas se hubiera situado 
sobre la curva a trazos habríamos tenido que concluir que la inferior deprivación no tenía efecto 
alguno sobre la conducta de extinción. 


El experimento se puede replicar con el sujeto si se recobra primero la conducta de línea de base 
original. Esto se consigue sometiendo el organismo a dos ciclos más de recondicionamiento y 
extinción bajo un nivel de deprivación de 48 horas. Los resultados de las extinciones se muestran 
en la figura 8 con el segundo par de puntos correspondientes a 48 horas. A continuación se lleva a 
cabo otra sesión de extinción después de mantener al sujeto deprivado de comida durante 12 
horas. Observamos de nuevo que la disminución del número de respuestas de extinción es mucho 
mayor de lo que hubiera sido si se hubiera mantenido el nivel de deprivación a 48 horas, y el 
hecho de que el segundo punto correspondiente a 12 horas se sitúe más abajo que el primero 
refleja la disminución normal de las respuestas de extinción sucesiva. Del mismo modo pueden 
conseguirse replicaciones adicionales, incluso introduciendo variaciones en la secuencia. 
El resultado de una tercera replicación está representado por el último punto del gráfico 
correspondiente a 12 horas. 


En el apartado B de la figura 8 tenemos, pues, la representación de un experimento original y dos 
replicaciones posteriores del mismo, todas ellas efectuadas con el éxito utilizando el mismo 
sujeto, a pesar de que la línea de base no es constante. La distancia vertical entre cada punto 
correspondiente a 12 horas y la línea de trazos nos indica en qué medida se puede atribuir la 
disminución del número de respuestas de extinción al descenso en el nivel de deprivación de 
comida. Las diferencias entre puntos consecutivos correspondientes a 48 horas de deprivación y a 
12 horas de deprivación, respectivamente, muestran la disminución normal del número de 
respuestas de extinción a cada uno de estos niveles de deprivación de comida. Las replicaciones 
intrasujeto proporcionan datos, por lo tanto, que confirman y amplían a la vez el descubrimiento 
original. 


También podríamos haber obtenido información adicional de varios modos. Si, por ejemplo, 
hubiéramos escogido un tercer nivel de deprivación como línea de base, con referencia a la cual 
evaluar los efectos de 12 y 48 horas. Habrá sido posible también utilizar más de dos niveles de 
deprivación en las sesiones de prueba que la extinción. Esta técnica puede asimismo generalizarse 
a otros tipos de experimentos en que una línea de base cambiante quizá impida la replicación 
intrasujeto, dado que si se conocer la regularidad del cambio, éste puede tomarse en 
consideración a la hora de evaluar las replicaciones. 


También podemos encontrarnos con otros problemas. En nuestro ejemplo, tal vez se produzcan 
interacciones entre los dos niveles de deprivación, para citar un caso solamente. La diferencia 
observada entre los niveles de 12 y 48 horas quizá sea una función compuesta de la deprivación y 
del número de sesiones de extinción a que el sujeto ha estado sometido. Si ellos fuese cierto, los 
puntos correspondientes a un nivel de deprivación de 48 horas no coincidirian con la curva 
extrapolada del apartado B. tal vez ocurra, por ejemplo, que después del primer período de 
extinción a un nivel de deprivación de 12 horas, la curva correspondiente a la función bajo un nivel 
de 48 horas continúe por debajo de la línea de trazos. Sin embargo, tales posibilidades pueden 
comprobarse experimentalmente y, si existen, también pueden ser evaluadas. 


La tarea sera difícil, dado que para refinar los datos de la línea de base hasta el punto en que su 
utilidad no quede anulada por una excesiva variabilidad, se debe alcanzar un grado de control 
experimental mucho más riguroso que al que están acostumbrados muchos psicólogos 
experimentales. A fin de estudiar los posibles efectos de interacción entre la línea de base 
cambiante y las operaciones experimentales, el investigador deberá llevar a cabo un cierto 
número de experimentos detallados que le obligarán a perder mucho tiempo, sobre lo que en 
aquel momento la parecerán cuestiones secundarias. Pero así es la conducta. Allí donde surja este 
tipo de complicaciones, no existirá modo alguno de escapar a ellas. Hacerlo, equivaldrá, en todo 
caso, a eludir el propio objeto de estudio. Para el investigador cuyo interés en la conducta sea 
profundo y que a la vez posea la tradicional virtud científica de investigar un problema en todos 
sus aspectos relevantes, este tipo de complicaciones constituyen un desafío apasionante. 
Analizarlos y resolverlos es como añadir nuevas y significativas dimensiones al problema 
relativamente simple con el cual dio comienzo la investigación. 


Existe un segundo tipo de situación en que parece imposible aplicar la replicación intrasujeto; por 
ejemplo, cuando se estudia la conducta en el proceso de cambiar de un estado a otro. Un caso 
concreto y limitado de un estado de transición de esta naturaleza lo constituye el fenómeno que 
con frecuencia se denomina “aprendizaje”, en el que el valor inicial de la conducta suele ser 
próximo a cero. Muchos investigadores se han dado cuenta de que el estado inicial de la transición 
a menudo resulta imposible recuperar. Coloquemos, por ejemplo, un animal hambriento dentro 
de un recinto experimental por primera vez. Una palanca se halla a disposición del sujeto en su 
interior, de modo que si la aprieta caerá automáticamente un gránulo de comida dentro de una 
bandeja, donde el animal podrá cogerlo e ingerirlo, y nos interesa conocer la rapidez con que el 
sujeto aprende a apretar la palanca. Para medir el curso de este aprendizaje podemos registrar 
acumulativamente las respuestas a la palanca en función del tiempo, y observar como la tasa de 
respuestas va cambiando desde un valor próximo a cero hasta alcanzar su nivel final. En la figura 
9, apartado A, se muestra un ejemplo de registro en este tipo. Vemos cómo el animal emite 
primero unas pocas respuestas ampliamente espaciadas, y cómo su tasa aumenta gradualmente 
hasta alcanzar un valor final estable. Podemos ahora, si lo creemos de utilidad, encontrar la 
ecuación de la “curva de adquisición” que se ha dibujado. Ello nos reportaría una expresión 
matemática del estado de la conducta en términos de su tasa de emisión, al pasar a través de su 
estadio de transición. 


Nuestro interés se va a centrar ahora en la replicación. ¿Existe algún modo de comprobar nuestras 
observaciones mediante la obtención de una segunda curva de adquisición empleando el mismo 
animal? Un método aparentemente simple consistiría en extinguir la respuesta desconectando el 
mecanismo de suministración de gránulos de comida. Después de que la tasa de respuestas 
hubiera vuelto a su nivel normalmente bajo, podríamos conectar el mecanismo de alimentación 
de nuevo y observar la adquisición de la respuesta por segunda vez. Si esto se llevara a cabo, 
probablemente obtendríamos una curva como la representada en el apartado B de la figura 9. 
En lugar de observar un aumento gradual, veríamos como la tasa de respuesta camba de un modo 
relativamente brusco desde su estado original a su estado final, con sólo una breve fase 
intermedia de transición. S aceptamos esta situación, tal como ha solido ocurrir hasta ahora, sin 
un análisis crítico más detenido, deberemos abandonar la replicación intrasujeto como técnica Útil 
para establecer la fiabilidad de nuestro descubrimiento original, dado que si un estado de 
transición no es reversible no es tampoco susceptible de replicación intrasujeto. 
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FIGURA 9. En la curva A se representa la adquisición relativamente lenta de la respuesta de 
apretar la palanca en un animal experimental. La curva B ilustra la rápida re-adquisición de la 
misma respuesta inmediatamente después de un período de extinción. 


Observaciones como ésta han conducido a muchos psicólogos a concluir que los resultados de un 
aprendizaje inicial constituyen un cambio irreversible en la conducta del organismo. Algunos 
investigadores incluso postulan la existencia de un cambio irreversible dentro del organismo en 
cuestión, que en general tendría lugar en alguna parte del sistema nervioso. La búsqueda de la 
“sede del aprendizaje” dentro del cerebro o en cualquier otra parte continúa ocupando, en 
muchos campos, la atención especulativa e los científicos. 


Existe, sin embargo, un modo alternativo de enfocar este problema. Tal vez hayamos sido 
incapaces de recuperar el estado inicial de transición debido, no a un cambio irreversible en la 


conducta o en el sistema nervioso, sino más bien debido al incompleto control experimental de 
las variables que actúan en la transición. En el experimento sobre adquisición de una respuesta 
descrito más arriba, la variable que se introdujo era la relación entre la conducta de apretar la 
palanca y la administración de un gránulo de comida. Sabemos, sin embargo, que otras variables 
que el experimentador no controla son introducidas a la vez que esta relación directamente 
manipulada. Puede que los efectos de estas variables “escondidas”, a pesar de que acompañan 
automáticamente la introducción de la relación entre respuesta y gránulo, requieran operaciones 
experimentales independientes para ser eliminados. La operación de extinción, por ejemplo, tiene 
en este caso la función de destruir en gran medida la relación entre la respuesta de apretar la 
palanca y algunos eslabones subsiguientes en la cadena de acontecimientos que culmina con la 
ingestión del gránulo. Sin embargo, existen otros eslabones de la cadena que no resultan 
afectados en absoluto debido a que no se producen durante el procedimiento experimental de 
extinción. 


Antes de entrar en un análisis detallado de este fenómeno, permitaseme resumir en líneas 
generales lo que he intentado decir hasta aquí. El problema consiste en aparente imposibilidad de 
recuperar el estado de transición original. Si esta presunta irreversibilidad es, de hecho, 
verdadera, no será posible llevar a cabo una replicación intrasujeto. He mencionado, sin embargo, 
la posibilidad de que la irreversibilidad radique tal vez en algún lugar que no sea ni el organismo 
no su conducta, sino que se deba a un control experimental incompleto de las relaciones 
existentes entre la conducta del organismo y el ambiente que la controla. La operación 
experimental de extinción, tal como se suele llevar a cabo, sólo destruye algunas de las relaciones, 
y no todas, que se establecieron durante la adquisición inicial de la respuesta. Un estudio 
experimental más detenido de todos los factores que entran en juego, incluso aquellos que, por 
así decirlo, se colaron por la puerta trasera, puede hacernos reconsiderar la idea que nos 
habíamos formado de la irreversibilidad. 


El experimento de condicionamiento que he descrito antes se suele calificar de “simple”, aunque 
sólo lo resulta de un modo engañoso. Hemos analizado el fenómeno centrándonos, tanto 
conceptual como experimentalmente, en una compleja secuencia en que la respuesta de apretar 
la palanca es aislada y puesta de relieve por la Única razón de que la hemos escogido para 
registrarla (81, páginas 52-55). Entre las muchas conductas implicadas en esta secuencia, se 
encuentran aproximaciones a las cercanías de la palanca en las que el animal se levanta, o alarga 
sus extremidades hacia ella, la aprieta, la suelta, se acerca al comedero, se estira para alcanzar el 
gránulo, lo recoge, lo coloca en su boca, lo mastica y lo engulle. Entre los múltiples estímulos 
contenidos en esta secuencia, se hallan la visión de la palanca, su desplazamiento hacia abajo y 
hacia arriba, la bandeja del comedero, el ruido que produce el mecanismo administrador de 
comida, el sonido del gránulo al caer a la bandeja, la visión del gránulo, su textura, su sabor, etc. 
Ninguna de las respuestas es totalmente independiente de las otras, así como ningún estímulo 
que ejerza algún control sobre el animal es independiente de los demás estímulos que se hallan 
presentes en la cadena. Incluso podemos decir, más adecuadamente, que todas las respuestas de 
la secuencia debieron aprenderse, del mismo modo que se tuvo que aprender su relación con los 


estímulos apropiados. Los datos que nosotros hemos registrado ofrecen únicamente una imagen 
muy indirecta del proceso global, puesto que el animal no sólo aprendió las respuestas que le 
condujeran a apretar la palanca, sino que también tuvo que aprender a ir al comedero, a recoger 
el gránulo, a llevárselo a la boca, etcétera. Estas respuestas se aprendieron en su orden correcto, 
dentro de una secuencia, debido a que el reforzamiento que incidió sobre ellas estaba 
correlacionado con los estímulos apropiados, proporcionados tanto por el ambiente como por la 
conducta inmediatamente anterior. La aproximación al comedero, por ejemplo, sólo era 
reforzada después de que se produjera el sonido del mecanismo administrador de comida. 
Del mismo modo, estirarse para alcanzar el gránulo sólo podía ser reforzado después de que éste 
hubiera caído dentro de la bandeja, etc. 


Teniendo presentes estas complejidades, podemos pasar a analizar el procedimiento de extinción 
que utilizamos en nuestro intento de restituir la conducta a su nivel anterior al condicionamiento. 
¿Qué fue lo que en realidad extinguimos al desconectar el mecanismo administrador de comida? 
Una simple ojeada al punto de la secuencia en que introdujimos el cambio nos ayudará a 
contestar la pregunta. El punto crítico se sitúa en algún lugar entre la respuesta de apretar la 
palanca y la respuesta de acercarse al comedero. Una vez emitida la respuesta precisa de apretar 
la palanca, la mayor parte de los estímulos restantes no se presentan durante la extinción. Así, no 
hay sonido del mecanismo administrador de comida, ni tampoco el sonido que produce el gránulo 
al caer, ni su visión, ni su tacto, etcétera. Aún y asi, es posible que se produzca la aproximación al 
comedero, aunque en ausencia de los estímulos que la controlan. Las respuestas implicadas en 
recoger el gránulo y engullirlo resultan imposibles de emitirse bajo el contexto originalmente 
aprendido. 


Mientras que nuestro procedimiento experimental de extinción puede haberse restituido la 
respuesta de apretar la palanca a su nivel de emisión anterior al condicionamiento, los otros 
componentes de la secuencia total aprendida no pueden haber sufrido una extinción completa. 
Muchos de estos componentes ni tan sólo se han producido para permitir que la operación de no 
reforzar haya tenido algún efecto sobre ellos. Probablemente, en la medida en que los últimos 
componentes de la cadena formaban parte de la trama de reforzamiento condicionado de la 
respuesta de apretar la palanca, no se logró tan sólo que ésta redujera su frecuencia de emisión al 
nivel anterior al condicionamiento. Cuando se introdujo el reforzamiento de nuevo, en el intento 
de replicación, el animal no tuvo que volver a aprender toda la secuencia, puesto que no se habia 
extinguido toda ella. La nueva curva del registro de respuestas a la palanca estaba influenciada 
por un cierto número de variables que no estuvieron presentes en el experimento original. 
Es decir, que el proceso de aprendizaje que se medía no era el mismo en ambos casos. 


Si se prestará atención explícita, desde un punto de vista experimental, a todos los elementos de 
la secuencia, podría restituirse la conducta a su verdadero nivel original, con lo que sería posible la 
replicación intrasujeto. Por ejemplo, se podría conseguir una extinción más completa de la 
secuencia total si se hiciera producir al mecanismo administrador de comida, aunque estando 
vacío, su ruido característico. También se podrían hacer caer los gránulos dentro de la bandeja del 
comedero, pero interponiendo una barrera entre ellos y el animal, de modo que le resultara 


inaccesible. Probablemente sería incluso más efectivo substituir el gránulo verdadero por otro 
que no tuviera ningún sabor ni valor nutritivo, de modo que el animal lo cogiese y tragase, hasta 
que incluso estas respuestas se hubieran extinguido. Si se pudieran llevar a cabo operaciones 
como éstas, tal vez nos acercaríamos a la reversibilidad total del proceso. 


El caso que he citado es, a la vez, muy concreto y difícil, pero el principio que ejemplifica es 
susceptible de aplicación general. Cuando una irreversibilidad aparente parece impedir la 
replicación intrasujeto de un estado de transición, debemos tomar en cuenta la posibilidad de que 
hayan entrado en juego variables incontroladas durante la transición. Aunque estas variables no 
se introduzcan deliberadamente pueden requerir, sin embargo, una manipulación deliberada a fin 
de neutralizar sus efectos, tarea que puede resultar complicada y técnicamente difícil. 
Sin embargo, y tal como he apuntado más arriba, aunque la complejidad en la naturaleza puede 
simplificarse, en principio, mediante la integración de fenómenos en un contexto sistemático, 
esta integración no es sinónimo de simplicidad experimental. Las sistematizaciones más claras, 
simples y satisfactorias suelen ser el producto de una labor experimental inevitablemente 
concienzuda, ardua y esmerada. 


A fin de que el ejemplo precedente no se considere excesivamente hipotético, puesto que los 
experimentos sugeridos no se han llevado a cabo, permitaseme describir otro caso tal como, en 
esencia, ocurrió. Los investigadores tenían interés por someter a control experimental un 
determinado tipo de conducta de evitación relativamente poco explorado. El lugar de utilizar el 
shock eléctrico como estímulo que el sujeto (una paloma) debería evitar, quisieron emplear un 
estimulo que, en la experiencia del ave, se había asociado con la ausencia de reforzamiento, o sea, 
extinción. Voy a describir a continuación el modo en que montó el experimento.*? 


Se colocaron al alcance de la paloma dos discos iluminados, de modo que le resultar fácil picar 
sobre ellos. La conducta de picar sobre el disco izquierdo cuando estaba iluminado por una luz 
roja, hacía que una pequeña tolva conteniendo grano se pusiera ocasionalmente a disposición del 
animal. A veces, sin embargo, este disco situado a la izquierda del sujeto cambiaba de color, de 
tojo a verde. En presencia de la luz verde, el mecanismo que ponía la tolva llena de grano al 
alcance de la paloma quedaba desconectado, de modo que las respuestas al disco dejaban de 
obtener reforzamiento. El sujeto aprendió, a la larga, a abandonar su picoteo sobre el disco 
cuando éste se hallaba verde, mientras que, por el contrario, emitía una tasa de respuestas 
estable en presencia del color rojo. A partir de este momento, se colocó el color del disco 
izquierdo bajo el control de la conducta del propio sujeto. En cuanto aparecía el verde, podía 
hacerlo cambiar a rojo de nuevo si picaba sobre el disco situado a la derecha. Además. Si picaba 
sobre este disco mientras el de la izquierda estaba rojo, se posponía por un cierto tiempo el 
cambio de color a verde. Así, pues, la paloma podía controlar el color del disco situado a su 
izquierda de dos maneras distintas: o bien picando sobre el disco de la derecha con la frecuencia 
suficiente para que la luz verde no tuviera ocasión de aparecer, o bien, si permitía que apareciera 
este color, podía hacerlo volver a rojo de nuevo mediante un Único picotazo sobre el disco de la 
derecha. De este modo, un picotazo sobre este disco podía, según el momento en que se 


produjera, o bien posponer o bien eliminar el color verde asociado con la ausencia de 
reforzamiento. 


Hasta este punto el experimento tuvo éxito, puesto que parecía haberse sometido a control la 
conducta de evitación del tipo descrito. Varias palomas aprendieron, tanto a evitar el cambio de 
color de la luz de rojo a verde, picando sobre el disco derecho, como a escapar de este segundo 
color cada vez que fracasaban en evitarlo. De este modo se mantenía una tasa de respuestas 
consistente y estaba sobre el disco situado a la derecha del sujeto. Sin embargo, los 
experimentadores no se dieron por satisfechos con una replicación entre sujetos del fenómeno, y, 
puesto que querían investigarlo de un modo más intensivo en un sujeto individual, fue necesario 
determinar si se había conseguido o no el control suficiente para lograrlo. Se hizo necesario, pues, 
llevar a cabo una replicación intrasujeto. 


El primer paso consistió en averiguar si el efecto era reversible. ¿Podría extinguirse la conducta 
que se emitía sobre el disco derecho y volverla a instaurar más tarde, a conveniencia del 
experimentador? Con vistas a responder a esta pregunta, los investigadores desconectaron 
aquella parte del equipo experimental que permitía volverse verde a la luz del disco izquierdo. 
Por consiguiente, el color de este disco permanecía rojo en todo momento, independientemente 
de la conducta que emitiera la paloma sobre el disco de la derecha. Esta operación es análoga a la 
que se realiza cuando desconectamos el mecanismo de administración de shocks elé ctricos en 
una situación experimental de evitación de shocks y cuyo resultado es, normalmente, la eventual 
desaparición de la conducta de evitación. En este punto el experimento tropezó, sin embargo, con 
un obstáculo, dado que se observó que el pájaro continuaba respondiendo al disco derecho, 
aunque tales respuestas ya no cumplieran, al parecer, ninguna unción. Como consecuencias, 
parecía inevitable descartar la posibilidad de llevar a cabo una replicación intrasujeto. 


Afortunadamente, los experimentadores no abonaron esta línea de investigación. Aunque se 
hallaban ante una situación experimental en la que habían conseguido llevar a cabo una 
replicación entre sujetos, pero que no parecía permitir una replicación intrasujeto, estaban 
convencidos de tener entre manos un ejemplo genuino de conducta de evitación. Experimentos 
previos habían demostrado que las palomas no picaban sobre el segundo disco simplemente 
porque estuviera a su alcance. Las contingencias de evitación y escapada en que tomaba parte el 
segundo disco debían, por lo tanto, ser responsables del aumento original en la tasa de respuestas 
que emitía la paloma al disco de la derecha. Los experimentadores llegaron pues a la conclusión 
de que alguna otra variable había entrado en escena en un estadio posterior. Después de que 
fueron eliminadas las contingencias de escapada y evitación, este nuevo actor tuvo que ser el 
responsable de que se mantuviera la conducta en cuestión. Por lo tanto, y en vez de abandonar la 
técnica que ya habian comenzado a aplicar, los experimentadores se propusieron identificar este 
actor incontrolado. Si podía ser identificado, se podía también eliminar, y sería factible intentar 
llevar a cabo una replicación intrasujeto del descubrimiento básico. 


A partir de aquí, la historia se acerca rápidamente a un final feliz, cuyos detalles describiré 
someramente. Los investigadores se acordaron de algunos experimentos previos en los que una 


conducta, que no era reforzada por el experimentador de un modo explícito, cala 
accidentalmente bajo el control de un reforzamiento con comida.** Es decir, que la conducta se 
emitía, por casualidad, inmediatamente antes de la administración de la comida. A pesar de que 
el reforzamiento no dependía de la emisión de la conducta en cuestión, la correlación existente 
debida al azar provocaba un aumento en su tasa. Por consiguiente, la probabilidad de que se 
produjeran nuevas correlaciones accidentales con reforzamientos subsiguientes aumentaba, 
originándose así un proceso en espiral. A la larga, la conducta caía bajo el control del 
reforzamiento de un modo casi tan preciso y eficaz como si la correlación se hubiese establecido 
deliberadamente por parte del experimentador (para una descripción más detallada de este 


experimento, ver capítulo 12, páginas 331-332). 


En el experimento sobre evitación descrito más arriba hubiera podido tener lugar, pues, un 
proceso similar al que acabamos de exponer que produjese el mantenimiento de la conducta 
sobre el disco de la derecha. Ocasionalmente, la paloma podía picar sobre el disco de la derecha e 
inmediatamente después sobre el de la izquierda, obteniendo comida con la última respuesta. 
Aunque sólo se requiriera la respuesta al disco izquierdo para hacer subir la tolva de grano, su 
aparición quizá constituyera un reforzamiento accidental de la respuesta previamente emitida 
sobre el disco derecho. Estas correlaciones accidentales. Entre la aparición de la comida y la 
conducta de picar sobre el disco derecho, podrían haber sido las causantes de que esta conducta 
se mantuviera, incluso después de que ya no resultara necesario emitir ninguna conducta de 
escapada y evitación. Basándose en un razonamiento similar a éste, los experimentadores 
modificaron ligeramente el procedimiento, disponiendo los aparatos del equipo experimental de 
programación de tal modo que una respuesta sobre el disco izquierdo no hiciera ascender la tolva 
de grano si el sujeto había emitido alguna respuesta sobre le derecho en el transcurso de los tres 
segundos que precedían a aquélla. De este modo, siempre transcurrían, como mínimo, tres 
segundos entre una respuesta al disco de la derecha y la aparición de la comida. Este retraso del 
reforzamiento accidental cumplió a la perfección con su propósito, puesto que desapareció la 
conducta sobre el disco derecho. Restableciendo las contingencias de evitación y escapada 
originales, se logró que volviera a aparecer la conducta en cuestión, y retirándolas otra vez, la 
conducta se reducía de nuevo hasta alcanzar un valor próximo a cero. De este modo, se consiguió 
llevar a cabo la replicación intrasujeto, y el grado de control experimental que se alcanzó con ello 
permitió iniciar un fructífero programa de investigación. 


Quiero llamar de nueva la atención sobre el hecho de que la replicación intrasujeto no constituye 
un camino fácil de seguir. Problemas semejantes al que acabo de describir requieren, para su 
solución, tanto una técnica refinada como una inventiva creadora, y no existe ninguna alternativa 
para ello. Una psicología que no pueda describir, sistematizar y controlar la fuente original de 
todos sus datos —la conducta de un individuo— está condenada a ser la hermana pobre de las 
demás ciencias. La replicación intrasujeto constituye una de nuestras más poderosas 
herramientas para determinar la adecuación del control experimental que hemos alcanzado, y, 
por lo tanto, para evaluar los datos que podamos obtener. 


Hasta ahora me he referido a la replicación intrasujeto como su siempre fuera posible llevarla a 
cabo, recalcando la necesidad de esforzarse por lograrla aun en aquellos casos donde no parece 
factible a primera vista. Sin embargo, no puede descartarse una posible alternativa. 
Una transición inicial puede, en realidad, provocar un cambio permanente en el estado 
conductual de un organismo, debido a lo cual un proceso resultará verdaderamente irreversible. 
Sin embargo, sé de pocos experimentos que hasta la fecha se hayan orientado expresamente a la 
resolución de este problema. En lugar de la investigación empírica se ha escogido, generalmente, 
uno de los dos posibles caminos a seguir cuando se presenta una aparente irreversibilidad. 


Una alternativa consiste en ignorar los efectos de transición y concentrar los esfuerzos de la 
investigación en los estados estables reversibles. Este modo de enfocar el problema que 
discutiremos con más detalle en capítulos posteriores, adolece de la evidente debilidad de excluir 
del estudio datos interesantes. 


Una segunda posibilidad, que resulta ser la más frecuentemente empleada, consiste en utilizar un 
grupo distinto de sujetos cada vez que se ha de estudiar el efecto de una variable dada sobre una 
fase de transición. Desgraciadamente, y tal como he apuntado con anterioridad, la relevancia de 
kis datos resultantes depende de la distribución en la población de varios parámetros de los 
procesos conductuales individuales en cuestión. La misma naturaleza de esta técnica estadística 
impide la determinación de los valores de dichos parámetros en los individuos de la población, 
puesto que cada individuo no es expuesto a más de un solo valor de la variable. Varios autores han 
demostrado que los datos obtenidos por este método pueden dar lugar a una descripción 
inexacta, o incluso alza, de la conducta de un individuo. Así, la componenda que se lleva a cabo 
usando de este modo grupos de sujetos resulta bastante extraña, puesto que los datos resultantes 
ni son adecuados como descripción de la conducta de un individuo, ni constituyen, tampoco, el 
tipo de datos agrupados que el psicólogo social consideraría de su incumbencia. Sin embargo, los 
resultados obtenidos de este modo pueden poseer un alto grado de fiabilidad, y, como tales, no 
deben excluirse tajantemente del dominio de la ciencia, pero no son generalizables ni entre 
sujetos individuales ni entre grupos de sujetos relacionados por una interacción de tipo social. 


Vemos, pues, que la replicación intrasujeto como técnica para establecer la fiabilidad y 
generalidad, da lugar a algunos peliagudos problemas que no se pueden resolver 
satisfactoriamente con las técnicas actuales de uso más general. Sin embargo, es posible que el 
desafío que presentan estas dificultades pueda afrontarse con éxito mediante la aplicación de 
principios tradicionales de experimentación y habilidad experimental creadora. Sobre estas 
posibilidades me extenderé más adelante cuando tratemos de la replicación sistemática y del 
diseño experimental. 


Con las técnicas de replicación descritas anteriormente, así como con las que se describirán más 
adelante, se aumenta el peso de la evidencia de los hallazgos cuando los experimentos son 
llevados a cabo por investigadores o laboratorios distintos y, del mismo modo, los datos ganan en 
fiabilidad cuando son replicados por científicos afiliados a una teoría rival. El científico individual 
tiene tendencia a dar por sentado que los datos replicados por ciertos colegas suyos tienen más 


posibilidades de resultar fiables que los replicados por otros. A pesar de que no hay ninguna base 
lógica que justifique este tipo de decisiones, constituyen, sin embargo, una manifestación de la 
experiencia científica práctica acumulada. 


El papel que juega la experiencia individual en la evaluación de datos es todavía más complejo. 
Por ejemplo, en la investigación bilógica en general, y en particular en la psicología, algunos de los 
detalles técnicos más significativos de un experimento se omiten en el informe que de él se 
publica, simplemente porque su importancia pasó desapercibida en aquel momento, o bien 
debido a que los pequeños detalles de una técnica determinada pueden resultar demasiado 
profusos e intrincados para describirlos en letra impresa. Por esta razón, constituye una práctica 
común en las ciencias biológicas el que un investigador visite personalmente al creador de una 
técnica experimental o a otro que la aplica con éxito, con objeto de aprender directamente a 
usarla. Un experimentador que disponga de una larga experiencia con los “laberintos”, puede 
fracasar fácilmente en un intento de replicar algunos descubrimientos de los “condicionadores 
operantes”, debido a algo tan simple como es el uso de una cinta programadora de intervalo 
variable en la que se han perforado intervalos demasiado largos. Análogamente, el no saber 
orientar adecuadamente una rata en el punto de partida de un laboratorio en “T”, puede 
convencer al condicionador operante de que los datos obtenidos con dicho laberinto no son 
fiables. Los fracasos en la replicación deben juzgarse con referencia al historial y habilidad 
adquirida por el experimentador en un campo determinado, aunque en otras áreas su 
investigación le haya merecido una justificada reputación. 


IV. Replicación sistemática 


Normalmente, el investigador con experiencia aprecia mucho más el grado de fiabilidad y las 
limitaciones e sus técnicas que no lo haría un científico que nunca las hubiera usado. Por regla 
general, ha llevado a cabo un gran número de experimentos que no ha llegado a publicar, algunos 
por ser excesivamente triviales, algunos más porque simplemente han fracasado debido a una 
técnica defectuosa y otros, finalmente, por estar en tan grande contradicción con el conocimiento 
establecido que el investigador duda en hacerlos públicos hasta que haya podido desarrollar un 
marco sistemático dentro de cual situarlos. En este caso habrá comprobado sus instrumentos de 
medición innumerables veces, habrá descubierto que los propios datos muestran algunas señales 
peligrosas, y habrá llevado a cabo, aunque no de un modo sistemático, un gran número de 
observaciones de las variables que inciden en el proceso en cuestión, incluso de algunas cuya 
incidencia es accidental. A partir de toda esta experiencia el científico extrae, por destilación, una 
apreciación subjetiva de la fiabilidad de los datos concretos. 


Trasladémonos ahora del científico en general al psicólogo experimental en particular, y 
supongamos que acaba de terminar una serie de observaciones en la que un único organismo ha 
sido expuesto a un determinado conjunto de operaciones experimentales, cuyo resultado ha sido 
una relación ordenada entre estas operaciones y la conducta del sujeto. Se encuentra ahora ante 
la tarea de demostrar la fiabilidad de sus hallazgos, lo que puede conseguirse ya sea mediante la 
replicación directa o sistemática. Es en este punto donde entra en juego, en el laboratorio, la 


probabilidad subjetiva. Si le experiencia del psicólogo le ha dado confianza en sus técnicas, 
escogerá la replicación sistemática, en vez de directa, como herramienta con la que establecer la 
fiabilidad de sus hallazgos. En lugar de repetir simplemente el experimento, utilizará los datos 
obtenidos con él, como base a partir de la cual realizar nuevos experimentos, y obtener así datos 
relacionados adicionales. 


Una de las restricciones más sagradas, impuestas al diseño experimental en psicología, consiste en 
la necesidad de que todos los sujetos de una investigación sean tratados del mismo modo, excepto 
en lo que a la variable independiente en cuestión se refiere. Esta restricción, limita, de hecho, la 
replicación sistemática como método prioritario para establecer la fiabilidad y la generalidad, 
puesto que cada replicación sistemática llevada a cabo con éxito demuestra que el fenómeno 
descubierto puede observarse bajo condiciones distintas de las que prevalecían en el experimento 
original. Allí donde la replicación directa ayude a establecer la generalidad de un fenómeno entre 
los miembros de una especie, la replicación sistemática también puede lograrlo, a la vez que 
extiende la generalidad del fenómeno en cuestión a una gran variedad de situaciones distintas. 
Es debido a ello que un experimentador que haya desarrollado una “sensibilidad” hacia un área de 
investigación determinada, renunciara deliberadamente a controlar ciertas variables. Así, si por 
ejemplo está llevando a cabo un experimento con animales inferiores, tal vez permita que sus 
sujetos difieran en nivel de deprivación de comida, historia previa, edad, duración de las sesiones 
experimentales, así como en otras variables adicionales que quizás hayan demostrado ser 
relevantes en otros contextos. Si a pesar de estas diferencias obtiene relaciones funcionales 
equiparables, en cada uno de sus sujetos, nuestro experimentador habrá logrado una replicación 
con éxito y más generalizable que no hubiera sido posible de haber procedido de forma distinta. 


Sin embargo, este procedimiento acarrea un grave riesgo. Si la replicación fracasa, será necesario 
volver a realizar el experimento original, puesto que no existe ningún procedimiento para 
determinar si el fracaso en la replicación se debió a la introducción de nuevas variables en el 
segundo experimento o bien a un control inadecuado de los factores relevantes en el primero. 


Por otra parte, si la replicación sistemática tiene éxito, la recompensa es elevada, puesto que no 
sólo resulta acrecentada la fiabilidad del hallazgo original, sino también su generalidad con 
respecto a otros organismos y a otros procedimientos experimentales. Además, se dispone de 
datos adicionales que no se habían podido obtener con la mera repetición del primer 
experimento. 


Esta última cuestión requiere como mínimo una breve consideración de lo que podríamos 
denominar “economía de la experimentación”. El principal fruto de una ciencia experimental son 
los datos. Para el investigador, la economía de tiempo y espacio, así como el presupuesto de que 
dispone, determinan profundamente su programa experimental. El científico se enfrenta con el 
eterno problema de utilizar sus recursos con el máximo de productividad, manteniendo al mismo 
tiempo la calidad del producto, y la replicación sistemática constituye un método útil, largamente 
comprobado, para aumentar tanto la cantidad como la calidad del trabajo del investigador. Así, un 
experimento original puede, por ejemplo, haber ocupado largo tiempo, resultando a la vez 


intrincado y laborioso. La replicación directa no sólo ocuparía, pues, una gran porción del tiempo 
de que dispone un investigador, sino que inmovilizaría un equipo experimental costoso que de 
otro modo podría usarse en obtener otra información importante. Por el contrario, la replicación 
sistemática proporcionaría fiabilidad, generalidad e información adicional. 


Debo recalcar aquí que de ningún modo pretendo justificar el uso de la replicación sistemática 
como estratagema para ahorrar trabajo, y que tampoco la considero una fórmula mágica que 
permitirá al científico dedicar más tiempo a su familia o a sus diversiones. En realidad, las técnicas 
de replicación sistemática no permiten ninguna remisión del esfuerzo experimental, sino que 
constituyen únicamente una eficaz ayuda mediante la cual el experimentador puede llevar a cabo 
una distribución más provechosa de dicho esfuerzo. 


LA TÉCNICA DE “LÍNEA DE BASE” EN LA REPLICACIÓN SISTEMÁTICA 


Muy próxima a una replicación directa se sitúa una forma de replicación sistemática que se 
caracteriza por la utilización de un fenómeno conductual dado como línea de base a partir de la 
cual investigar otras variables. Efectivamente, en este tipo de replicación se repite el experimento 
original, aunque esta repetición del experimento no constituye un fin en sí misma. 


Por ejemplo, la conducta generada por un procedimiento experimental dado puede poseer 
exactamente aquellas propiedades requeridas para investigar un problema insoluble hasta aquel 
momento. Así, la larga serie de experimentos llevados a cabo por Brady y Hunt y sus 
colaboradores, en que la técnica de supresión condicionada de Estes-Skinner?? proporcionaba una 
línea de base para la investigación objetiva de la terapéutica a base de shocks electroconvulsivos 
(ECS), puede ejemplificar nuestras palabras.*? Esta línea de base consistía en una interrupción 
condicionada de la tasa normalmente estable de respuestas de apretar una palanca, mantenida 
por un programa de reforzamiento de intervalo variable (ver el capítulo 3, páginas 92-94 ). 
Los investigadores exploraron un gran número de problemas que acarreaba la utilización del ECS 
para modificar la conducta. Después de establecer el hecho de que el ECS eliminaba la 
interrupción conductual condicionada de la línea de base de intervalo variable que he citado más 
arriba, los experimentadores continuaron su investigación estudiando la duración del efecto, su 
especificación conductual, el papel que jugaban el número y el espaciamiento temporal de los 
tratamientos con ECS, etc. Sus experimentos no sólo constituían un programa de investigación 
autónomo, sino que al mismo tiempo servían para establecer y consolidar la técnica de 
Estes-Skinner como herramienta de investigación fiable y generalizable. Posteriormente, esta 
técnica fue ampliada para obtener líneas de base a partir de las cuales estudiar los efectos 
conductuales de lesiones cerebrales y fármacos, así como establecer experimentalmente 
relaciones funcionales entre la manipulación de la conducta y la función endocrina. De este modo, 
a lo largo del proceso de abrir y sistematizar nuevos campos de investigación, se replicó repetidas 
veces el descubrimiento original. 


Merece la pena que nos fijemos en otro efecto interesante de la técnica de línea de base en la 
replicación, dado que ilustra uno de los varios modos de generar nuevos experimentos. A lo largo 
de la secuencia de experimentos en los que la supresión condicionada servía de línea de base 
conductual, algunas consideraciones de orden práctico aconsejaron la introducción de muchos 
cambios en el procedimiento original. Así, por ejemplo, los sujetos originales con los que se 
experimentó eran ratas blancas. Sin embargo, cuando el trabajo estaba ya bastante adelantado, as 
ratas fueron substituidas por monos, debido a que éstos ofrecían un soporte biológico más 
conveniente para las técnicas fisiológicas implicadas en muchos de los experimentos. Con objeto 
de aumentar el número de datos que se podían obtener en un tiempo limitado, los investigadores 
utilizaron el descubrimiento de Azrin,? mediante el cual un gran número de asociaciones de 
estímulo y shock (la operación que daba lugar a la supresión conductual) podía ser incluido dentro 
de una sola sesión experimental (ver la figura 6), mientras que en los experimentos originales 
solamente se había llevado a cabo una asociación de este tipo por cada sesión. A fin de reducir al 
mínimo los efectos del shock en sí sobre algunas de las mediciones fisiológicas, se empleó un 
procedimiento de “reforzamiento intermitente”, en el cual solamente se administraban los shocks 
después de un bajo porcentaje de estímulos supresores, e incluso en algunas sesiones 
experimentales se presentaron dichos estímulos sin ir acompañados en absoluto de shock. 


Estas variaciones de procedimiento descritas, juntamente con muchas otras, parecían producir 
ligeras alteraciones en la conducta de línea de base, lo cual, consiguientemente, creaba un interés 
renovado por el fenómeno de supresión condicionada en sí mismo. De esta forma se 
emprendieron un cierto número de estudios para determinar explícitamente, en términos 
conductuales, las consecuencias de los cambios de procedimiento. De este modo, la manipulación 
de variables como resultado de consideraciones más o menos prácticas de colaboración científica, 
impulsó a la realización de una serie adicional de experimentos meramente conductuales. 
Como consecuencia, aumentó de un modo considerable nuestro control sobre el fenómeno de 
supresión condicionada, convirtiéndose a su vez en una herramienta de investigación todavía más 
útil, dado que una comprensión más completa del fenómeno permitió una mejor integración con 
datos pertenecientes a otras áreas. Finalmente, el gran número de replicaciones sistemáticas que 
se efectuaron, muchas de las cuales describiré más adelante, consolidaron la fiabilidad y la 
creciente generalidad de toda la estructura de conocimientos. ”* 


La técnica de línea de base en la replicación resulta factible y valiosa sólo cuando se ha conseguido 
una forma de conducta extremadamente estable en una situación experimental dada. Sin 
embargo, alcanza su máxima utilidad cuando es posible mantener la línea de base a un nivel 
intermedio, de modo que otras variables la puedan modificar en cualquier dirección. Así, por 
ejemplo, la conducta de evitación se había estudiado durante mucho tiempo por medio de una 
técnica que imponía un límite superior a la medición del comportamiento del sujeto.” 
Dicha técnica consistía en la presentación de un estímulo de advertencia, al que seguía un shock 
después de pocos segundos si el sujeto no emitía una respuesta determinada. Si dicha respuesta 


tenía lugar durante la presentación del estímulo y antes del shock, éste no llegaba a administrarse. 


Se repitió este procedimiento con intervalos seleccionados hasta que se hubieron observado un 
cierto número de “ensayos”. 


La medida de la actuación del sujeto la constituía, de un modo característico, el porcentaje de 
presentaciones del estímulo en que se emitía la respuesta de evitación. A pesar de que se logró 
mantener dicha respuesta de evitación a un nivel estable, la medida utilizada no permitía usar la 
conducta de un modo muy ventajoso como línea de base a partir de la cual medir la actuación 
individual. Así, por ejemplo, cuando el sujeto se comportaba a un nivel de eficacia del 100 por 
cien, o muy próximo a este valor, no podía investigarse ninguna variable que hiciera mejorar el 
nivel de conducta. Para el estudio de variables que lo elevaran, el único método posible consistía 
en mantener la conducta a un bajo nivel de eficacia en la evitación de shocks, de modo que, por 
ejemplo, el sujeto lograra evitar sólo un 50 por ciento de los mismos. Sin embargo, un nivel bajo 
de eficacia en la conducta de evitación, en una situación como ésta, implica, también, un control 
experimental deficiente, dado que si al conducta se mantiene débil, ello es debido a que las 
variables que controlan su tasa de emisión no se aplican en valores que permitan una evitación 
eficaz. 


En estas circunstancias no es de extrañar que sólo encontremos pocas aplicaciones de este 
procedimiento como línea de base con respecto a la cual medir la conducta individual. 
Es solamente a altos niveles de eficacia que la conducta es susceptible de replicación por medio de 
la técnica de la línea de base. 


Esta crítica de la metodología clásica de evitación adquiere gran validez en vista del tipo de 
desarrollo que siguió a la introducción de una técnica distinta.69 La principal característica de esta 
nueva técnica que más nos puede interesar aquí, es la eliminación de la medida de la “eficacia” en 
la conducta de evitación, puesto que la eficacia tiene un límite natural superior en el 100 por 
ciento. En vez de medir la actuación del sujeto con relación al número de shocks que consigue 
evitar, utilizaremos la tasa de respuestas de evitación para describir su conducta. Así, utilizando 
una situación de “libre respuesta”, es decir, una situación tal en que el sujeto puede emitir la 
respuesta de evitación en cualquier momento, y permitiendo que cada una de estas respuestas 
posponga el shock, podemos conseguir una tasa estable de conducta de evitación susceptible de 
medición continuada a lo largo del tiempo. 


A pesar de que la conducta tenga un “techo” impuesto por la capacidad física del organismo, la 
medida de la tasa puede variar, con todo, dentro de un intervalo lo suficientemente amplio para 
reflejar los efectos de todas las variables significativas en cuanto a conducta de evitación se 
refiere, exceptuando, quizás, un reducido número de ellas. Además, e incluso de mayor interés 
con vistas al análisis de la técnica que nos ocupa, se puede manipular la tasa de respuestas de 
evitación de un modo ordenado, sobrepasando ampliamente el punto en que el sujeto logra evitar 
el máximo número de shocks. De un modo parecido, la tasa de respuesta puede reducirse hasta 
casi hacerla desaparecer sin disminuir materialmente el grado de eficacia en la evitación de los 
shocks. Así, pues, tanto a tasas altas como a tasas bajas, la línea de base continúa siendo de 
conducta de evitación. 


Como consecuencia de esta técnica modificada de evitación, se obtuvo para la conducta individual 
de una línea de base muy sensible. A su introducción siguió, de un modo casi automático, un uso 
cada vez mayor de la técnica de línea de base en la replicación sistemática dentro de 
investigaciones sobre conducta de evitación. De este modo, se llevaron a cabo una serie de 
estudios experimentales en los que se utilizó la línea de base original para correlacionar los efectos 
de las variables ambientales y fisiológicas con la conducta, y en cuanto a la técnica de supresión 
condicionada, se introdujeron modificaciones en la línea de base, que a su vez se replicaron 
mediante técnicas similares. Y, de nuevo, la línea de base resultó no sólo fiable y generalizable a 
situaciones nuevas, sino que su utilización más extendida en distintos contextos sirvió para 
comprenderla mejor en sí misma. El desarrollo de un nuevo tipo de línea de base conductual suele 
permitir, e incluso forzar, el planteamiento de nuevas preguntas sobre la naturaleza de la 
conducta, preguntas cuya posibilidad ni tan sólo se había sospechado hasta que tuvo lugar el 
desarrollo de una técnica apropiada. Finalmente, y para completar esta exposición, es necesario 
añadir que la técnica clásica de evitación, tratada desde un ángulo experimental diferente, obtuvo 
un nuevo status sistemático como caso especial dentro de una clase más general de fenómenos de 
evitación. 


La historia completa de este logro deberá aguardar una exposición de más detallada,?” aunque por 
el momento es significativo como ejemplo de un método útil para llevar a cabo la replicación 
sistemática de datos individuales mediante la técnica de línea de base. El ejemplo es drástico y 
desafiante: si un investigador desea explorar un área en la que las técnicas de que se dispone no 
permiten generar líneas de base individuales sensibles y controlables con precisión, su primer 
empeño consistirá, o bien en abandonar por completo la vieja metodología, o bien en modificarla 
hasta que cumpla con los requisitos deseados. Si, por el contrario, simplemente adopta las normas 
de control inadecuado y falta de sensibilidad, que tal vez fueron necesarias a los esfuerzos 
pioneros en un campo virgen, su posición eventual en la historia de su ciencia no será ni la de un 
pionero ni la de sintetizador, ni tan sólo la de eslabón intermedio. Su labor será simplemente la de 
un remendón, representativa de un período estéril en el progreso, tradicionalmente discontinuo, 
de la ciencia. Ello puede ocurrirle, desde luego, a cualquier investigador, independientemente de 
la importancia que sus coetáneos atribuyan a su trabajo: sin embargo, resulta bastante triste 
aceptar este papel voluntariamente. 


LA TÉCNICA DE LÍNEA DE BASE Y LA EXPERIMENTACIÓN SOBRE APRENDIZAJE 


A partir de un descubrimiento inicial pueden surgir, por tanto, una serie de experimentos distintos 
entre sí, aunque con un hilo común en forma de línea de base conductual que los una. La noción 
de línea de base no se ha desarrollado extensamente hasta hace poco tiempo, debido en parte a la 
aceptación poco crítica del veredicto de que la conducta es demasiado variable para ser estudiada 
en un organismo individual. Los términos “variabilidad” y “línea de base” son incompatibles, 
puesto que a menos que una línea de base sea estable, su utilidad experimental es nula. 


El uso que he hecho del calificativo “poco crítico” ala caracterizar la aceptación de la variabilidad 
por parte de los psicólogos es deliberado. No intento negar la existencia de la variabilidad, pero 
existen muchos tipos de variabilidad y muchas maneras de tratarla (Ver capítulos 5 y 6.) 


Un segundo factor que ha retrasado la extensión del uso líneas de base conductuales es el 
desarrollo de un campo de investigación dentro de la psicología experimental denominado 
“aprendizaje”. Los que trabajan en este campo están interesados por la adquisición de nueva 
conducta, y es de suponer que no les interesa demasiado la conducta que ha alcanzado un estado 
“asintótico” u otro estado estable. El término “adquisición” se refiere comúnmente a la aparición 
de nuevas formas de conducta que no existían en el repertorio del organismo antes de realizarse 
las manipulaciones experimentales. Debido a que se supone, a todos los fines prácticos, que la 
conducta adquirida existía originalmente a un nivel igual a cero, los que estudian el aprendizaje 
rara vez llegan a considerar el estado de línea de base de la conducta del sujeto como un 
parámetro de adquisición. El argumento usual consiste en defender que una línea de base 
conductual con un valor mayor que cero impondría una condición especial, de modo que las 
características de la adquisición no podrían generalizarse a otras situaciones. 


Sin embargo, cabe preguntarse si la adquisición de una conducta a partir de una línea de base 
nula, suponiendo que realmente lo sea, constituye un fenómeno menos especial que su 
adquisición a partir de un estado más activo. ¿Acaso no constituye asimismo un caso de 
adquisición, por ejemplo, el pasar de una pauta de conducta a otra? La adaptación de una 
conducta existente a una nueva variable es un ejemplo de aprendizaje cuyo estudio haría 
incrementar grandemente la generalidad de los principios de aprendizaje. En la figura 10 la 
conducta de línea de base (apretar una palanca) se había mantenido mediante una programa de 
reforzamiento de intervalo fijo, el cual ponía los reforzamientos a disposición del sujeto (una rata) 
cada cinco minutos. 


RESPUESTAS 


| HORA 


TIEMPO 


FIGURA 10. La curva A representa la conducta de apretar la palanca de una rata bajo un programa 
de reforzamiento de intervalo fijo de cinco minutos. La curva B muestra la transición a una alta 
tasa de respuesta después de cambiar el programa de reforzamiento a razón fija de cuatro 
respuestas por reforzamiento. (De Skinner, 81, p. 280.) 


El registro acumulativo ilustra en A la conducta de línea de base. En el registro B, el programa de 
reforzamiento se cambió a razón fija, requiriéndose cuatro respuestas por cada reforzamiento. 
La curva inferior ilustra el estado de transición a través del cual pasó la tasa de respuesta del 
organismo a medida que se ajustaba al nuevo programa. ¿Es acaso este cambio menos 
ejemplificador de un proceso de aprendizaje que la adquisición original de la propia respuesta de 
apretar la palanca? 


La noción de una línea de base conductual resulta incomprensible si no es con relación a la 
conducta de un solo individuo. Si el experimentador no dispone de técnicas que permitan la 
manipulación y el control de la conducta individual, no puede aspirar a estudiar las transiciones 
conductuales, con un grado de precisión aceptable, como función de estados de línea de base 
mayores que cero. Consiguientemente, muchos investigadores escogen lo que a primera vista 
parece la solución más fácil, investigando procesos de transición desde una línea de base de valor 
igual a cero, y descuidando fenómenos como el ilustrado en la figura 10. Ello les exime de la 
necesidad de manipular la conducta antes de que introduzcan las variables que darán lugar a 
aprendizaje. Como consecuencia de ello, la mayor parte de las teorías actuales sobre el 
aprendizaje se basan en un conjunto de experimentos especializados y limitados que restringen 
innecesariamente su generalidad. Cualquier transición que resulte de cambios ocurridos en las 
contingencias ambientales que mantienen la conducta cae dentro del dominio del aprendizaje, y 
no hay ningún fundamento racional para excluir las transiciones que tienen lugar desde un nivel de 
línea de base mayor que cero. 


Un problema que todavía viene más al caso es, tal vez, el grado en que realmente se verifica la 
suposición de que la línea de base es igual a cero, en los estudios tradicionales sobre adquisición. 
La conducta de apretar la palanca raramente existe con una probabilidad de emisión totalmente 
nula antes de que el experimentador refuerce deliberadamente la respuesta. Incluso cuando este 
nivel inicial es identificado empíricamente se acostumbra a restar simplemente el valor observado 
de línea de base del estado final, y calcular así, por ejemplo, la velocidad de aprendizaje. Es 
dudoso, sin embargo, que la transición esté relacionada de un modo tan simple con el estado 
inicial. Se pueden hacer consideraciones similares acerca de otros tipos clásicos de experimentos 
como, por ejemplo, aquellos que miden la velocidad de un sujeto a lo largo de un corredor, la 
conducta de elección en un laberinto, los efectos consecutivos de un aprendizaje repetido, etc. 
En la mayor parte de estos experimentos la línea de base no es igual a cero, sino desconocida. Sin 
embargo, cabe preguntarnos si ignorar deliberadamente el estado de línea de base si ignorar 
deliberadamente el estado de línea de base es preferible a aceptar un estado determinado pero 
especificable. 


Con este último comentario, nuestra vagante divagación nos conduce de nuevo a la técnica de 
línea de base en la replicación sistemática, y creo oportuno sugerir que un uso más general de 
líneas de base conductuales, sistemáticamente replicadas, en el estudio de la adquisición, dará 
lugar a un aumento de generalidad para esta área de investigación, más en consonancia con su 
epígrafe tan general de “aprendizaje”. Las propiedades de la adquisición son función del estado 
previo de la conducta, aunque para investigar dichas relaciones funcionales debemos poseer 


técnicas para generar y mantener niveles estables de conducta a partir de los cuales medir las 
transiciones. La replicación sistemática de las líneas de base revela sus propiedades, con lo cual se 
obtiene un mayor control, que cuanto más riguroso, más útil resulta. Del mismo modo, cuanto 
mayor sea la variedad de situaciones en las que se utiliza una línea de base dada, y a cuantas más 
operaciones experimentales sea sometida, mayor resultará la generalidad no sólo de la línea de 
base en sí misma, sino de las transiciones que la toman como punto de partida. La técnica de la 
línea de base en la replicación sistemática constituye, pues, una herramienta natural para el 
estudio del aprendizaje, y cada aplicación de una nueva operación experimental que consiga 
producir una alteración de la línea de base original, automáticamente da lugar a una curva de 
adquisición. Replicando la línea de base con variaciones sucesivas en sus propios parámetros de 
control, será posible obtener un cuadro más completo de las transiciones subsiguientes a una 
operación experimental dada, desarrollándose así una ciencia del aprendizaje que tome en 
consideración una gran variedad, tanto cuantitativa como cualitativa, de operaciones y de líneas 
de base. 


LA TÉCNICA DE “SONDA” EN LA REPLICACIÓN SISTEMÁTICA 


Las propiedades de algunos tipos de conducta hacen que éstos resulten útiles como sondas que 
clarifican procesos conductuales en situaciones distintas de as originales. Así, cuando un 
descubrimiento original cae dentro de esta categoría, el experimentador puede decidir utilizar la 
técnica de sonda de la replicación sistemática en lugar de, o además de, la técnica e línea de base. 


SONDEO DEL ESTADO CONDUCTUAL 


Supongamos que debemos observar varios cambios conductuales a lo largo de un período de 
tiempo dilatado —horas, días o incluso semanas—. En este caso, deberemos mantener la conducta 
de línea de base durante el período de observación requerido. Sin embargo, puede producirse una 
contradicción, debido a que el tipo particular de línea de base que deseamos estudiar quizá resulte 
inadecuado para mantener la emisión de conducta durante un periodo de tiempo tan largo como 
el requerido. También puede suceder que una línea de base adecuada para este propósito resulte 
insensible a la variable cuyos efectos deseamos estudiar. En un caso como éste puede aplicarse la 
técnica de sonda. La conducta puede mantenerse mediante una línea de base insensible a la 
variable de aplicación a largo plazo que estamos investigando, y los cambios conductuales bajo 
estudio pueden sondearse mediante la aplicación, en determinados momentos, de un 
procedimiento de línea de base más sensible. A fin de conseguirlo, la línea de base de sondeo 
debe poseer propiedades conocidas de antemano, sobre las cuales hayamos alcanzado un alto 
grado de control experimental. Por consiguiente, el uso de una línea de base de este tipo no sólo 
ayudará a obtener una nueva información sino que también constituirá una replicación de los 
descubrimientos previos en que dicha línea de base se halla implicada. 


La técnica de sonda se utilizó, por ejemplo, para estudiar los cambios conductuales bajo la 
deprivación de sueño. Se halló que un programa de reforzamiento que requiriese pausas de tres 
minutos como mínimo entre respuestas consecutivas mantenía la conducta de picar en una 
paloma hambrienta durante varios días consecutivos, sin que se produjera ninguna pausa entre 
respuestas de más de quince minutos, y muy pocas de más cinco.86 En este experimento, la 
paloma picaba sobre un disco blanco, de modo que si cualquier respuesta al disco iba precedida de 
un período de tres minutos o más, en que no se hubiera emitido ninguna respuesta, aquélla 
proporcionaba a la paloma un breve acceso a la tolva de grano. 


A intervalos de una hora, el color del disco cambiaba a blanco, a rojo o verde, indistintamente. 
Cuando se hallaba del segundo color, la primera respuesta que se produjera después de diez 
minutos obtenía un reforzamiento (programa de intervalo fijo). Por otra parte, cuando el color del 
disco era rojo, se le reforzaba por cada cincuenta respuestas emitidas (programa de razón fija). 
El programa de intervalo fijo, bajo las condiciones de este experimento, genera de un modo típico 
una conducta caracterizada por una baja tasa de respuestas al disco al principio del intervalo, con 
una aceleración positiva gradual a medida que se acerca al término del intervalo y, por ende, el 
reforzamiento. La actuación bajo el programa de razón fija se caracteriza por una tasa de 
respuesta permanente alta (ver la figura 7). 


Se utilizó entonces el procedimiento de espaciamiento de respuestas para mantener la conducta 
de picar durante el curso de este experimento de larga duración (nuestra conocida línea de base). 
Sin embargo, el color del disco cambiaba una vez cada hora, indicando que entraba en vigor o bien 
el programa de razón fija, o bien el de intervalo fijo, y todo cambio observado en la conducta de 
picar de la paloma durante la aplicación de las sondas de intervalo y de razón reflejaba los efectos 
de la progresiva deprivación de sueño.*” Sin embargo, los programas de intervalo y de razón fija no 
hubieran mantenido, por sí solos, la conducta de picar de la paloma bajo una creciente falta de 
sueño. La utilización de los programas de intervalo y de razón como sondas del estado conductual 
en un momento determinado sirvieron tanto para esclarecer los efectos de una variable no 
estudiada previamente en este contexto como para proporcionar una replicación adicional a datos 
pertenecientes a programas de reforzamiento obtenidos previamente. 


Las sondas conductuales, utilizando y replicando relaciones conocidas entre la conducta y el 
ambiente que la controla, pueden usarse también para detectar cambios de corta duración en el 
estado de la conducta. En la técnica de espaciamiento de respuestas, por ejemplo, las pausas 
entre respuestas se generan debido a que el reforzamiento es contingente a las respuestas que 
van precedidas de una pausa. Si se está interesado en estudiar el estado de la conducta tal y como 
tiene lugar durante las pausas, cuando no se puede observar ninguna muestra de la respuesta 
registrada, hay un método para atacar este problema, consistente en desarrollar una segunda 
muestra de conducta para su utilización como sonda. Una segunda respuesta se somete a control 
de estímulo, de modo que se emita, con sus características conocidas, sólo en presencia de su 
estímulo. Acto seguido se presenta dicho estímulo sistemáticamente, en varios puntos dentro de 
las pausas que tienen lugar en la conducta de línea de base. Las características cambiantes de la 
segunda respuesta se observan como una función de su relación temporal con las respuestas 


espaciadas.”? Un procedimiento de este tipo resulta posible sólo cuando las propiedades de la 
sonda se conocen de antemano, y la técnica sirve, a su vez, para replicar aquellas propiedades 
observadas previamente. 


Al aplicar la técnica de sonda en la replicación, el experimentador hace un uso directo de las 
propiedades conocidas de la conducta, determinadas empíricamente, a fin de llevar a cabo un 
análisis más detallado del que hubiera sido posible en ausencia de este conocimiento. 
Este procedimiento ha sido, hasta hace poco tiempo, relativamente raro en psicología 
experimental, y ha resultado posible gracias a dos avances. El primero de ellos fue la extensión de 
la creencia de que la conducta del individuo es susceptible de ser sometida a un análisis funcional 
en términos de variables de control especificables, del mismo modo que los fenómenos que son 
estudiados por otras ciencias naturales. El segundo avance fue la puesta en práctica, de hecho, de 
un análisis funcional de este tipo, logro que está muy lejos de ser completo pero que aumenta en 
importancia a medida que nuevos fenómenos conductuales caen bajo control experimental. Hasta 
el momento en que fue posible manipular la conducta individual con relativa precisión, no se pudo 
utilizar la técnica de sonda para replicar y refinar los datos conductuales. A fin de utilizar al 
conducta como sonda, el experimentador debe ser capaz de producir la conducta adecuada 
siempre que, y cada vez que, desee aplicarla. Un fenómeno que tenga lugar un cierto número de 
veces, como promedio, en grupo de sujetos, nunca podrá utilizarse en este sentido. 


SONDEO DE LAS VARIABLES DE CONTROL 


En manos de un investigador hábil, un programa planeado coherentemente dará lugar a un 
conjunto de variables unificadoras, comunes a muchos experimentos relacionados. 
El descubrimiento y elaboración de estas variables constituye una categoría superior de 
sistematización, y el investigador debería, siempre que surja la oportunidad, perseguirlas hasta 
identificarlas. Sin embargo, la naturaleza de los datos requeridos para ello puede hacer que la 
labor sea ardua. A pesar de que el investigador pueda inferir que una sola variable es la causante 
de varias formas de conducta, todas ellas con apariencia distinta, estas mismas diferencias 
demuestran que el control de la variable es cuestión ha sido indirecto. Consiguientemente, deberá 
buscar una demostración, tan directa como sea posible, de le generalidad de la presunta variable. 
si dispone de una tecnología conductual perfeccionada, probablemente utilice la técnica de sonda 
para determinar si una variable dada es, en realidad, la variable de control en distintos contextos 
experimentales. En la aplicación de esta técnica también replicará y generalizará su propia 
tecnología. Casos como éste suelen ser relativamente complejos, e implican sutilezas de la técnica 
de sonda que merecen examinarse con detalle. Tomemos como ejemplo la técnica de programa 
tándem diseñada por Ferster y Skinner.** 


Entre las conclusiones que parecían derivarse de un dilatado programa de investigación sobre 
varios tipos de programas de reforzamiento, se encontraba la generalización de que las 
propiedades de la conducta a lo largo de grandes períodos de tiempo quedan determinadas por 
las características que muestra la conducta inmediatamente antes del reforzamiento. En un 


programa de intervalo variable, por ejemplo, las respuestas son reforzadas según una 
programación que sigue una distribución de intervalos de tiempo variables. La probabilidad de 
administración de reforzamiento aumenta a medida que transcurre el tiempo, de modo que, 
consiguientemente, las pausas relativamente largas que se produzcan, sin emisión de respuesta, 
muy probablemente terminen con una respuesta reforzada, mientras que las pausas cortas 
acabarán con gran probabilidad en una respuesta no reforzada. El resultado de ello es una tasa de 
respuestas intermedia, determinada por el programa de espaciamiento de reforzamientos. 


En un programa de razón, por el contrario, la administración de reforzamiento es relativamente 
independiente del paso del tiempo, pero requiere en contrapartida la emisión de un número de 
respuestas determinado. La probabilidad de reforzamiento no aumenta si el sujeto hace una pausa 
entre respuestas, e incluso admitiendo ligeras irregularidades en la tasa, es muy probable que el 
reforzamiento siga a una rápida racha de respuestas. Dado que la probabilidad de que una larga 
pausa termine con una respuesta reforzada es pequeña, se origina una tasa de respuesta alta, con 
un valor cercano al máximo posible. 


Este tipo de análisis parecía poderse aplicar a gran parte de la conducta generada por un elevado 
número de programas de reforzamiento distintos, dado que tanto la tasa como al pauta temporal 
de la conducta resultaban determinadas por el espaciamiento de respuestas que tenía lugar 
justamente antes del reforzamiento. Sin embargo, muchos de los programas constituían sólo 
métodos indirectos de controlar las características de la conducta anterior al reforzamiento. 
¿Se podría manipular este factor más directamente, así como analizar sus efectos con más detalle? 


Al intentar contestar estas preguntas, se diseñó la técnica de programa tándem. En un 
experimento, por ejemplo, el tándem estaba formado por dos programas, el primero de los cuales 
era un programa de intervalo variable (VI) que ya he descrito anteriormente. En este programa, la 
administración del reforzamiento sigue una distribución temporal variable, de modo que las 
respuestas del sujeto son reforzadas ocasionalmente, a intervalos de tiempo irregulares. Con este 
programa se estableció originalmente una tasa de respuestas intermedia y estable. El segundo 
programa, empleado como sonda con la que poder determinar la influencia de los factores que 
actuaban inmediatamente, antes del reforzamiento, se ha denominado programa de DRL 
(reforzamiento diferencial de tasas de respuesta bajas [*]). 


Este programa de DRL lleva a cabo el reforzamiento diferencial de tasas bajas mediante la 
operación de reforzar una respuesta sólo en el caso de que no se haya emitido ninguna otra 
dentro, por ejemplo, de los diez segundos precedentes. En un DRL de los 10 segundos, es posible 
que el sujeto obtenga un reforzamiento sólo cuando la conducta se emite a la tasa relativamente 
baja de una respuesta cada diez segundos o más. 


Se utilizaron propiedades conocidas del programa de DRL para determinar los efectos de los 
factores que actúan inmediatamente antes del reforzamiento sobre la conducta nominalmente 
mantenida por el programa de reforzamiento de intervalo variable. Los dos programas, de VI y 


* En inglés “Differential Reinforcement of Low response rate”. (N. del T.) 


DRL, se combinaron en un tándem de modo que una respuesta obtuviera reforzamiento a 
intervalos variables, pero, además, dicha respuesta no podía ser reforzada a menos que hubiesen 
transcurrido diez segundos, como mínimo, desde la respuesta precedente. De este modo, se 
mantuvo el programa de intervalo variable empleado para generar la conducta de línea de base. 
El programa de DRL, añadido en tándem, facilitó el control preciso sobre el intervalo de tiempo 
entre las dos respuestas que precedían inmediatamente a cada reforzamiento. Si únicamente 
hubiese operado el programa de intervalo variable, este intervalo entre respuestas habría sido 
variable, debido a las fluctuaciones locales en la tasa. Añadiendo el programa de DRL, el intervalo 
entre dos respuestas inmediatamente anteriores al reforzamiento, nunca podía ser menor de 10 
segundos. 


¿Cuál fue el efecto de la restricción añadida sobre la contingencia de reforzamiento? ¿Se mantuvo 
la tasa intermedia que normalmente generaba el programa de intervalo variable? ¿O acaso la 
especificación del transcurso de diez segundos, en cada uno de los intervalos que separaban las 
dos respuestas previas al reforzamiento, dio lugar a la baja tasa característica del programa de 
DRL? Esta última alternativa fue la que en realidad se produjo. Los animales utilizados como 
sujetos del experimento empezaron a espaciar la mayor parte de sus repuestas, de modo que la 
tasa descendió hasta alcanzar el nivel normalmente generado por un programa de DRL de diez 
segundos. Así, mediante la superposición estratégica de los factores causantes de la tasa baja, en 
el programa de intervalo variable, se convirtió a un organismo de respuesta rápida en otro de 
respuesta lenta.** 


Este experimento, además de demostrar la validez de un principio general inducido a partir de 
estudios previos sobre la programación de reforzamientos, permitió una económica replicación 
sistemática de las características conductuales del programa de DRL. Si las propiedades de este 
programa no se hubieran conocido de antemano, la disminución en la tasa, que siguió a la 
introducción del programa de DRL como sonda, hubiera constituido un descubrimiento 
asistemático, sin relación con otros datos e imposible de integrar bajo un principio más general. 


La replicación sistemática no señala necesariamente el límite ultimo de un descubrimiento 
experimental, lo que constituye una ventaja sobre la replicación directa. Mientras que ésta 
confirma lo que ya sabemos, la replicación sistemática puede proporcionar, además, una 
información adicional sobre el fenómeno en cuestión. Este extremo puede ilustrarse con otro 
experimento en el cual un programa de razón fija, en tándem con un programa de DRL, se utilizó 
como sonda para investigar el control ejercido por los factores que actúan inmediatamente antes 
del reforzamiento. 


En un programa de razón, una respuesta es reforzada sólo si ha sido precedida por un cierto 
número de respuestas. Excepto en la medida en que la respuesta misma ocupa un determinado 
tiempo, la probabilidad e reforzamiento no es función del transcurso del tiempo, como en el caso 
de los programas de intervalo variable y DRL. El reforzamiento depende simplemente del número 
de respuestas que el sujeto ha emitido. El programa de razón fija, que requiere un número de 


respuestas constante para cada reforzamiento, genera una tasa de respuesta extremadamente 
alta. 


¿Cuál sería el efecto de añadir un programa de razón fija en tándem a un DRL? ¿Sería la conducta 
resultante compatible con la generalización que se investiga, mostrando las propiedades 
conocidas de la sonda de razón fija? Según resultó, la conducta mostraba tanto las propiedades de 
razón fija como las de DRL, arrojando al mismo tiempo una nueva luz sobre las variables 
responsables de los efectos producidos por la programación de reforzamientos. 


El experimento con este tándem se realizó como a continuación se describe. En primer lugar, se 
llevó la respuesta a un estado estable bajo un programa de DRL de diez segundos, de modo que 
ninguna respuesta recibiera reforzamiento si se había emitido otra respuesta en el transcurso de 
los diez segundos precedentes. Toda respuesta que siguiera a la anterior tras diez o más segundos 
era reforzada. Como resultado de esta disposición de contingencias se producían respuestas 
espaciadas a la baja tasa característica del programa de DRL de diez segundos. Acto seguido se 
añadió en tándem un programa de razón fija de dos respuestas por reforzamiento. Las pausas de 
diez o más segundos continuaban permitiendo que una respuesta obtuviera reforzamiento, pero 
se requerían ahora dos respuestas para que aquél se llegara a administrar. De este modo, el 
espaciamiento de respuestas “permitía” el reforzamiento, pero su administración efectiva era 
provocada por el programa de razón fija. 


La conducta resultante mostro claramente los efectos de ambos programas. Así, se mantenían las 
características de DRL, con lo que las pausas de diez segundos, aproximadamente, continuaban 
teniendo lugar. La contingencia ambiental de razón resultaba también evidente debido a la 
frecuente emisión de “rachas”, diferenciadas en su espaciamiento, de dos respuestas muy juntas. 
La pauta temporal predominante de la conducta estaba formada por dos respuestas muy juntas, 
seguidas por una pausa de unos diez segundos más o menos, seguida a su vez por otras dos 
respuestas rápidas, seguidas por otra pausa de diez segundos, etc.58 


Vemos, pues, en este caso, una replicación simultánea de dos efectos debidos a la programación, 
lo cual constituye un logro excepcionalmente económico. Además, resulta evidente que no basta 
con explicar los efectos de un programa únicamente en términos de la tasa de respuesta que 
precede inmediatamente al reforzamiento. Nuestra generalización requiere ser modificada. 
El desarrollo de las características de razón suponía que el reforzamiento siempre seguía a la 
emisión de dos respuestas muy próximas entre sí, y sin embargo era preciso que tuviera lugar una 
pausa de diez segundos como mínimo para que el rápido par de respuestas pudiera ser reforzado. 
Así, pues, debe tomarse en consideración toda la secuencia reforzada, a pesar de que esta 
secuencia quizá se extienda hacia atrás, a partir del reforzamiento, a lo largo de un periodo de 
tiempo relativamente grande. Este hallazgo no sólo plantea nuevos problemas que investigar sino 
que promete aumentar el control del psicólogo sobre su objeto de estudio —la conducta del 
individuo— hasta un grado que rivaliza con el que se posee en las ciencias “exactas”. Tales son los 
frutos de la técnica de sonda en la replicación. 


La aplicación con éxito de la técnica de sonda proporciona, pues, un grado de generalidad mucho 
mayor que la mera generalidad de un sujeto. La demostración de que un principio abarca más que 
un mero grupo de datos, se incluye dentro del más alto orden de logros científicos. Aplicada con 
máxima habilidad, la técnica de sonda en la replicación proporciona este tipo de generalidad, a la 
vez que fiabilidad y generalidad de sujeto. ¿Puede hacerse alguna comparación realmente seria 
entre la técnica de sonda y el diseño estadístico convencional? Para utilizar un término apropiado 
a la historia agrícola del diseño estadístico, el “fruto” de la técnica de sonda es 
incomparablemente superior, tanto en cantidad como en calidad. Además, proporciona economía 
de esfuerzos, exactitud de control experimental y un carácter simplemente directo —en otras 
palabras, la elegancia indefinible que constituye uno de los más subjetivos, ¡lógicos y útiles 
criterios de que dispone el científico para evaluar la experimentación. 


REPLICACIÓN POR AFIRMACIÓN DEL CONSIGUIENTE 


Este tercer tipo de replicación sistemática es el más arriesgado y, cuando tiene éxito, con 
frecuencia es también el más satisfactorio. Su riesgo tiene un doble origen: (a) que el método no 
tiene justificación lógica, y (b) que no existe ningún criterio establecido para considerar los 
resultados obtenidos como éxito o fracaso. Tal como todo estudiante que haya asistido a un curso 
elemental de lógica sabe, la afirmación del consiguiente es un procedimiento muy arriesgado. 
De hecho, este procedimiento suele tildarse de “falacia”. Esta falacia lógica puede ilustrarse del 
modo siguiente: 


Empezamos con la proposición: “Si A es verdadero, B también lo es”. Acto seguido llevamos a cabo 
un experimento y hallamos que B es realmente verdadero. A partir de ello, concluimos que A 
también es verdadero. Nuestra conclusión puede resultar falsa, puesto que no establecimos que el 
hecho de que A fuese verdadero constituyera un prerrequisito necesario de la veracidad de B. 
A podría ser falso, a pesar de que no se siguiera de ello la falsedad de B. Así, pues, la veracidad de 
B no permite, desde un punto de vista lógico, hacer ninguna inferencia sobre A. 


No se puede contradecir al lógico en este asunto, pero el problema no termina aquí. A pocos 
estudiantes se les ha dicho, en el curso de lógica elemental, que afirmar el consiguiente, a pesar 
de ser una falacia lógica, está muy cerca de ser la savia de la ciencia. En otras palabras, hay una 
discrepancia entre las reglas lógicas y la práctica del laboratorio. 


Volviendo a nuestro ejemplo abstracto, todo científico bien preparado sabe que es peligroso hacer 
una inferencia de B a A. Sin embargo, la demostración de la veracidad de B algo le dice sobre A. 
Como mínimo ha eliminado uno de los factores que podrían haber demostrado la falsedad de A, 
dado que si B hubiese resultado falso, no se hubiera podido defender entonces la veracidad de A. 
De este modo el experimentador acrecienta, en una pequeña porción no cuantificable, su 
confianza en la veracidad de A. Después explorará otras consecuencias de esta veracidad, y 
comprobará experimentalmente las proposiciones C, D, E, F, etc., todas las cuales deben ser 
verdaderas para que se cumpla que A también lo es. Además, las consecuencias de los nuevos 


hallazgos que se realicen se someterán a una comprobación experimental del mismo género, de 
modo que cada demostración que se logre realizar aumentará nuestra confianza en la veracidad 
de A. 


Una prueba todavía más importante de la veracidad de A será la sistematización global que se 
consiga. Cuando se demuestra que varios hallazgos experimentales, a primera vista aislados, están 
relacionados en realidad, cada componente individual del sistema gana en importancia. Tomemos, 
como ejemplo de A, el siguiente experimento. Se enseñó al sujeto —una paloma- a picar sobre un 
disco iluminado situado en una pared del recinto experimental. El reforzamiento lo constituía la 
aparición de una tolva llena de grano, de la que el pájaro podía comer durante tres segundos. 
Se empleó un tipo especial de programa de reforzamiento de razón fija (en que el sujeto debe 
emitir un número fijo de respuestas por cada reforzamiento). En este experimento, la razón de 
respuestas requeridas por reforzamiento podía tomar uno de dos valores distintos, cambiando al 
azar después de cada reforzamiento. Así, en ocasiones se requerían 50 respuestas, y otras veces 
150, sin que se presentara ningún estímulo exteroceptivo que indicase al sujeto bajo cuál de las 
dos razones se hallaba (34, páginas 580 y siguientes). 


La conducta de la paloma siguió el típico esquema de razón fija, manteniéndose tasas de respuesta 
extremadamente altas, con frecuentes pausas inmediatamente después de los reforzamientos. 
Sin embargo, se observó un fenómeno interesante. A veces, cuando se hallaba bajo la razón de 
150, pausas similares a las que siguen a los reforzamientos, se producían cuando el sujeto había 
emitido más o menos 50 respuestas. La conducta de la paloma en aquel momento parecía hallarse 
bajo control del número respuestas que había emitido desde el reforzamiento precedente. 
La “cuenta” resultó ser un factor crítico en el comportamiento de razón. Cuando la paloma había 
terminado la cuenta del número de respuestas requerido en la razón pequeña, y no le llegaba el 
reforzamiento, aparecía la pausa o “estiramiento” característico de la razón mayor. 


Si esta interpretación de las pausas que tuvieron lugar después de aproximadamente 50 
respuestas es correcta, debería ser posible demostrar que la cuenta de respuestas es una variable 
que actúa en otros contextos. Así, por ejemplo, se llevó a cabo un experimento con ratas en el que 
había dos palancas a disposición de los animales. Para obtener reforzamiento, se requería a los 
sujetos que apretaran una de las palancas 12 veces, y a continuación apretaran la otra.”* Es decir, 
una palanca se hallaba bajo un programa de razón fija de 12 respuestas por reforzamiento, y los 
animales podían utilizar la cuenta de respuestas a esta palanca como indicio para cambiar a la otra 
y apretarla una sola vez. Su conducta demostró de modo concluyente que los animales utilizaban, 
de hecho, la cuenta de respuestas en este sentido, además de hacerlo con una eficacia 
considerable. Se demostró de un modo directo que la cuenta de respuestas era una variable que 
controlaba la conducta generada por un tipo de programa de razón fija, lo cual aumentó la 
plausibilidad de que esta misma variable fuera la causante de las pausas observadas en el 
experimento original. A medida que esta explicación del fenómeno va pareciendo más plausible, la 
misma observación resulta más generalizable. Por el contrario, una observación falsa no 
sobrevivirá mucho tiempo en el proceso de replicación sistemática. 


Un segundo conjunto de datos que ayudó a consolidar el descubrimiento original, surgió de la 
observación de la conducta durante la fase de transición que iba desde un programa de razón fija 
a otro. Así, por ejemplo, después de que la conducta de los sujetos (ratas) utilizados en un 
experimento se hubiese estabilizado bajo un programa de razón fija de 25 respuestas a la palanca 
por reforzamiento, se redujo la razón a solamente 15 respuestas. A pesar de que ahora se 
administraba el reforzamiento después de que se emitiera la décimaquinta respuesta, al principio 
los animales continuaron apretando la palanca más allá de las 15 respuestas, sin detenerse para 
ingerir el reforzamiento.*” Resultó, pues, que el número de 25 respuestas establecido previamente 
era lo suficientemente poderoso como para anular temporalmente el control ejercido por la 
administración del reforzamiento. Esta observación no sólo apoyaba el descubrimiento original, 
sino que, a su vez, era fortalecida por él, dado que el apoyo es, en este sentido, recíproco. 


Se consiguió una replicación sistemática más completa en un experimento cuya relación con el 
descubrimiento original parecía incluso más remota. Se demostró que la conducta generada por 
ciertos programas de reforzamiento de intervalo fijo también se halla bajo el control del número 
de respuestas emitidas durante el intervalo previo, a pesar de que el reforzamiento esté 
programado por un reloj. Nos encontramos aquí ante uno de los aspectos más ilógicos de la 
replicación por el método de afirmación del consiguiente, consistente en que, cuanto menor es su 
plausibilidad inicial, tanto más convincente resulta la replicación. Es decir, que cuanto menos 
plausible parezca alguna consecuencia de un descubrimiento. A, tanto mayor será nuestra 
confianza en la veracidad de A si se verifica dicha consecuencia. (Ver la cita de Polya, páginas 66- 


68.) 


La plausibilidad es un concepto extraño a la estadística clásica, y con razón, puesto que el 
significado de este término se deriva como mínimo tanto del observador como de la cosa 
observada, y no existe una escala de plausibilidad común a todos los observadores. Su subjetividad 
hace que el concepto de plausibilidad sea, de hecho, una noción de lo más científico. Y, sin 
embargo, los científicos la usan con provecho, dado que han descubierto, por propia experiencia, 
que los intentos de demostrar lo obvio resultan lo más interesantes cuando fracasan, y que son 
estos fracasos los que dan lugar a las revoluciones científicas. Sin embargo, la demostración de 
veracidad de una consecuencia poco plausible es la forma más satisfactoria de replicación 
sistemática. Cuando se pueden descubrir muchos factores que parecen ir en contra de la realidad 
de una consecuencia, ésta es poco plausible. Si al consecuencia en cuestión puede pasar por el 
tamiz de escepticismo inteligente y sobrevivir a los golpes que le propinan las comprobaciones 
empíricas, la importancia del descubrimiento original queda enormemente aumentada. Ha dado a 
luz a una casta más robusta de lo normal, lo cual atestigua su propio vigor. ¿Es esto poesía? Lo es, 
indudablemente, y también es ciencia de buena ley. Las dos se juntan, debido a que tanto los 
científicos como los poetas —al menos los mejores de entre ellos— saben más cosas de las que las 
reglas de la lógica les permitirían deducir de la evidencia de que disponen. Casi siempre el 
descubrimiento ha precedido a la comprobación, y no siempre es la misma persona la que ejerce 
ambas funciones. A pesar de ello, se suele dar crédito al descubridor, aun cuando la evidencia 
formalmente convincente sea aportada por otro. Los científicos pueden hablar con ampulosidad 


acerca de la fría objetividad de su cometido, pero su otra conducta es evidencia de que su 
conocimiento llega más lejos. 


Debido a su falta de lógica y a que no puede aportar ninguna prueba definitiva de una proposición 
cualquiera, el método de afirmación del consiguiente no nos permite convencer a los dubitativos, 
mediante argumentos lógicos, de la veracidad de nuestra evidencia. Si una estructura sistemática, 
conseguida mediante la afirmación del consiguiente, resulta verdaderamente sólida, entonces los 
datos comprendidos en dicha estructura eventualmente se admitirán en el redil, y se convertirán a 
su vez en la base de una futura y más completa sistematización. La comprobación final es de tipo 
pragmático. El siguiente párrafo, publicado por Thomas Huxley en 1897, ilustra a aplicación de 
este principio a algunos datos que en alguna época estuvieron sometidos a fuertes controversias, 
pero que han quedado sólidamente establecidos por un método que no podía ser otro que el de la 
afirmación del consiguiente: 


No hace mucho tiempo, la cuestión de si los llamados “fósiles” eran realmente los restos de animales y 
plantas, se discutía acaloradamente. Muchas personas eruditas sostenían que no eran nada parecido, sino 
una especie de formación, o cristalización que había tenido lugar dentro de la piedra en que se hallaban. 
Sólo simulaban las formas de la vida animal y vegetal, de la misma manera en que la escarcha sobre el cristal 
de una ventana imita la vegetación... Esta postura resulta inexpugnable, puesto que es totalmente imposible 
demostrar lo contrario. Si alguien se empeña en sostener que una concha de ostra fósil, a pesar de su 
correspondencia hasta sus menores detalles con la de una ostra recién sacada del mar, nunca perteneció a 
una ostra viva, sino que es una formación mineral, no hay modo alguno de demostrar su error. Todo lo más 
se puede hacer, por similitud de razonamientos, es obligarlo a admitir que un montón de ostras de conchas 
ante la cabaña de un pescador también puede deberse a un “capricho de la naturaleza”, y que un hueso de 
cordero en un cubo de basura puede haber tenido el mismo origen. Cuando no se puede demostrar que 
alguien se equivoca, sino solamente que está defendiendo un absurdo, lo mejor es dejarle en paz (49, 
páginas 12 y 13). 


Debido a que la replicación por el método de afirmar el consiguiente encierra un peligro real, 
muchos científicos prefieren, con un enfoque conservador, no utilizar esta técnica hasta haber 
empleado anteriormente procedimientos de replicación más directos. Allí donde la inferencia 
lógica desde un hallazgo experimental a otro es tenue, o donde incluso la relación sistemática de 
los dos experimentos pueda constituir un asunto de juicio individual, hay un gran margen para el 
error. La historia del experimentador es, en este aspecto, un factor importante. Hay algunos 
científicos que parecen ser capaces de afirmar el consiguiente con casi total impunidad, y sería una 
tontería no escucharles con respeto. Por otra parte, sucede con demasiada frecuencia que, 
intentando identificar una nueva variable, surge una racha de replicaciones sistemáticas en las que 
se supone incorrectamente que la nueva variable es el nexo de unión entre ellas. Esta nueva 
variable cabalga sobre un mero capricho, de modo que resulta posible atribuir todo tipo de 
cambios conductuales a su acción. Este caso puede ser más probable si las condiciones bajo las 
que actúa la nueva variable son todavía deficientes comprendidas. 


En una época, por ejemplo, los psicólogos se inclinaban a atribuir todo tipo de datos 
experimentales, que no sabían explicar de otro modo, a la operación del reforzamiento 


secundario. Muchos y variados tipos de experimentos se consideraban replicaciones sistemáticas 
y, por consiguiente, generalizaciones de esta variable. Esta tendencia ha cesado rápidamente 
desde que nos hemos dado cuenta de lo poco que sabemos acerca de las circunstancias bajo las 
que opera el reforzamiento secundario. Situaciones de este tipo rara vez duran mucho tiempo, 
aunque probablemente sea mejor aprender a convivir con ellas que eliminarlas a costa de perder 
las inapreciables contribuciones de aquéllos que tienen habilidad para afirmar el consiguiente. 
Los errores que de ello provenga se corregirán a medida que la experimentación posterior revele 
que muchas de las supuestas conexiones entre experimentos eran más aparentes que reales. 


Un problema más serio se deriva del hecho de que el proceso de replicación sistemática mediante 
la afirmación del consiguiente no tiene fin. En ningún momento puede concluirse que se ha 
logrado totalmente una replicación definitiva. Las implicaciones de un hallazgo experimental 
pueden ser infinitas, y podemos tropezarnos con un caso negativo que lo desmienta a la vuelta de 
la esquina. 


¿Qué sucede cuando surge un caso negativo? Existen muchos factores que determinan el curso de 
la acción a emprender en estos casos. El experimentador debe evaluar el número de 
consecuencias de A que han sido confirmadas, su plausibilidad, así como lo directo o tenue de su 
conexión tanto con A como con el caso negativo, y debe aplicar los criterios usuales, a todos los 
datos afectados, del rigor del control experimental. Ello le llevará a considerar otros tipos de 
replicación, tanto directa como sistemática, que se han logrado llevar a cabo, así como la 
reputación de los experimentadores implicados en el caso. El investigador quizás encuentre 
entonces discrepancias en los datos que habían sido pasados por alto. Quizás identifique 
afirmaciones incluidas en resúmenes conclusivos no confirmadas por los datos, o también puede 
encontrarse con datos que no habían sido tomados en consideración. Tal vez su propio caso 
negativo se ajustará a estas facetas, en cuyo caso su contribución será altamente positiva. 


Pero ¿qué ocurre si la inspección del área en cuestión no logra revelar ninguna debilidad 
importante en la estructura empírica? En este caso, debe someterse la validez del caso negativo a 
una comprobación más detenida. El científico dirigirá su atención a las replicaciones, tanto 
directas como sistemáticas del caso negativo. Si éste se mantiene igualmente después de ser 
sometido a replicación, el científico se inclinará a sospechar que los factores que definían el 
hallazgo original se habían especificado de un modo inadecuado. Tal vez la exposición original de 
los factores relevantes a los experimentos originales fue demasiado general y no tomó en 
consideración las variables específicas que controlaban el proceso. O, tal vez, dicha exposición 
original fue demasiado restringida de modo que no se identificaron las suficientes variables, y una 
mejor especificación de éstas podría integrar el caso negativo, o tal vez pusiera de manifiesto su 
falta de conexión con el fenómeno original. 


Es difícil encontrar casos en psicología experimental que se puedan clasificar taxativamente en 
blancos y negros, pero se han dado muchos casos en varios tonos de gris. Por ejemplo, un tipo de 
descubrimiento que ha parecido replicable en una gran variedad de situaciones, se refiere al grado 
de control conductual ejercido por un estímulo en función de su relación temporal con el 


reforzamiento. Se ha observado que, en una situación de evitación, cuanto mayor sea el intervalo 
de tiempo entre el estímulo de advertencia y el shock, más débil es el condicionamiento de 
evitación.” Otros experimentos han mostrado que, más allá de un valor óptimo, cuanto mayor sea 
la duración de un estímulo que preceda a un shock inevitable, tanto menor es la supresión 
conductual producida por el estímulo en cuestión.*? También se ha podido llegar a la conclusión, a 
partir de algunos datos, de que la eficacia reforzadora condicionada de un estímulo alcanza un 
máximo y a continuación decrece, a medida que aumentamos la duración del estímulo previo a un 
reforzamiento positivo.” La generalización que parecía derivarse de todos estos estudios era que, a 
mayor duración de un estímulo anterior a un shock o a un reforzamiento, menos control 
conductual ejercía el control en cuestión. 


Estos hallazgos han sido replicados tanto directa como sistemáticamente por medio de un cierto 
número de montajes experimentales distintos. Sin embargo, ha habido algunos experimentos que 
han producido hallazgos imposibles de integrar, y es indudable que existen muchos otros que 
nunca han sido publicados debido a que sus resultados han parecido contrarios al peso de la 
evidencia. Recientemente se ha dirigido la atención experimental a las discrepancias, y la 
conclusión abrumadora ha sido que los experimentos originales simplemente habían fracasado en 
identificar algunas variables muy poderosas. Los datos obtenidos en estos antiguos experimentos 
no pueden considerarse equivocados por esta razón, sino que vienen a representar, simplemente, 
casos especiales dentro de un marco más general. Cuando se toman en consideración las variables 
adicionales, tanto los datos originales como las aparentes contradicciones caben bajo el mismo 
techo, y, en la medida en que so experimentos más antiguos no controlaron adecuadamente las 
nuevas variables descubiertas, no constituyen, sin embargo, replicaciones sistemáticas válidas 
dentro del sistema general. 


Más concretamente, un conjunto de experimentos ha demostrado que alargando el intervalo 
entre el estímulo y el shock se produce un condicionamiento de evitación menor sólo cuando el 
estímulo en cuestión es breve (condicionamiento vestigial).*% Si el estímulo de advertencia está 
presente desde su inicio hasta la administración del shock (condicionamiento de dilación), los 
cambios operados en la duración del estímulo parecen tener poco efecto.*? Otros experimentos 
han mostrado que cualquier evaluación de los efectos de la duración del estímulo debe tomar en 
consideración la longitud del intervalo de tiempo entre presentaciones consecutivas de dicho 
estímulo. La duración del estímulo per se no es siempre la variable crítica. Así, un estímulo de 
larga duración puede ejercer un control conductual débil si el intervalo entre estímulos 
consecutivos es relativamente breve, mientras que si dicho intervalo se alarga, una misma 
duración del estímulo puede ejercer un control conductual intenso. Algunos experimentos han ido 
aún más lejos, demostrando que tanto las contingencias de reforzamiento en presencia del 
estímulo como las que existen en ausencia del mismo, contribuyen poderosamente a su eficacia 
(34, páginas 658-702). También está resultando evidente que, al menos en algunos casos, las 
variables de reforzamiento son básicas para la comprensión de los factores temporales.*? 


Debido a ello, una especificación más adecuada de las variables relevantes a un fenómeno o a un 
proceso conductual puede contribuir a explicar las discrepancias que surjan al intentar al 


replicación por el método de afirmar el consiguiente. Una parte del trabajo llevado a cabo en sus 
comienzos por Schoenfeld, Antonitis y Bersh 65 ejemplifica otro caso de reforzamiento 
condicionado o secundario. Originalmente, estos investigadores llevaron a cabo dos experimentos 
para investigar “...la posibilidad de que las propiedades reforzadoras condicionadas conferidas a 
un estímulo previamente neutral pueden actuar independientemente de las condiciones 
presentes en el momento de su adquisición” (65, página 40). Era éste un problema intrincado, 
pero su investigación fracasó por completo cuando el estímulo en cuestión no mostró, en 
absoluto, ninguna función reforzadora condicionada bajo ninguna de las condiciones 
experimentales. Los investigadores fueron, pues, incapaces de llevar a cabo una replicación del 
fenómeno sobre el que buscaban una información más general. 


En el siguiente paso que emprendieron, los investigadores llevaron a cabo un experimento tan 
simple como fue posible, de modo que se ajustara a la especificación predominante en aquel 
momento de las condiciones necesarias para el establecimiento de un reforzamiento 
condicionado. Utilizando estos procedimientos, resultó imposible establecer un reforzador 
secundario. Evidentemente, las especificaciones seguidas para convertir un estímulo en reforzador 
condicionado eran demasiado imprecisas. Un examen más detenido de los procedimientos y 
parámetros empleados en las replicaciones primitivas, tanto las que tuvieron éxito como las que 
fracasaron, condujo a los experimentadores a realizar un descubrimiento (implícito, por otra parte, 
en los primeros escritos de B.F. Skinner [81]) del papel decisivo que jugaba el encadenamiento 
operante en el fenómeno del reforzamiento condicionado. Al tomarse en consideración la 
presencia o ausencia de dicho encadenamiento, los investigadores pudieron llevar a cabo 
replicaciones sistemáticas sobre el reforzamiento condicionado, y ambos conjuntos de datos 
resultaron compatibles entre sí una vez que se hubieron especificado más adecuadamente los 
factores que controlaban el proceso. 


Ya me he referido anteriormente a los problemas que suelen surgir cuando la irreversibilidad de 
los procesos impiden la replicación de un experimento en un único organismo. La técnica de 
afirmar el consiguiente ofrece una solución a estos problemas. En vez de intentar la replicación de 
los datos en sí, puede lograrse la replicación investigando las implicaciones de los datos en 
cuestión. 


Así, se lleva a cabo una serie de experimentos, cada uno de los cuales arroja datos compatibles 
con los obtenidos en los demás, la fiabilidad y generalidad de los experimentos individuales se ven 
grandemente aumentadas. El número de experimentos de este tipo que es conveniente realizar 
no puede prejuzgarse, puesto que dependerá de los mismos criterios personales, subjetivos y 
pragmáticos que tanto la ciencia como los científicos individuales han aprendido a usar en la 
evaluación de todo tipo de datos. 


DATOS Y TEORÍA 


La técnica de afirmar el consiguiente se utiliza frecuentemente como método para comprobar 
teorías. Es igualmente aplicable, aunque en realidad se aplica con menos frecuencia, a la 
comprobación de la fiabilidad y generalidad de los datos experimentales. Si un cierto resultado 
experimental es realmente fiable y general, y si disponemos de una comprensión adecuada de las 
variables implicadas, debería ser posible especificar por adelantado los resultados de otros 
experimentos. Este proceso no es necesariamente deductivo, sino que la inferencia de un 
experimento a otro puede realizarse mediante inducción, o incluso mediante analogía. 
Los experimentos pueden ser tan distintos desde un punto de vista operacional que su única 
conexión sea el paso inductivo en sí. Cuando éste sea el caso, la confirmación del hallazgo puede 
añadir un peso adicional a los datos originales, mayor de lo que sería si las replicaciones sucesivas 
fueran más claramente similares. Ello constituye una extensión del principio de que una 
confirmación improbable nos inspira más confianza que otra altamente probable. 


A pesar de que la técnica de afirmar el consiguiente puede usarse para evaluar tanto teorías como 
datos, en general suele reservarse para las teorías. Los criterios utilizados para la evaluación de 
datos son en gran medida estadísticos, y resultan relativamente rigurosos. Es frecuente desechar 
un variable (considerándola ineficaz) si puede demostrarse que los cambios observados en la 


pe 


conducta pueden haber sido producto del “azar”, en una proporción incluso tan pequeña como de 
dos veces entre cien, y casi siempre se rechaza totalmente la hipótesis si el riesgo llega a alcanzar 
un valor de cinco por ciento. Por el contrario, una evidencia del cincuenta por ciento en contra de 


una teoría, rara vez llevarás al psicólogo teórico a abandonarla. 


La razón de ello resulta evidente al examinar las controversias teóricas de la pasada década, en la 
que incluso las teorías más rigurosamente planteadas resultaban demasiado imprecisas para 
poder llevar a cabo ningún experimento crucial. Es decir, que las condiciones bajo las que A es 
verdadero nunca se especifican de antemano, y si una implicación de la teoría no puede ser 
confirmada mediante la experimentación, al teórico que la defiende siempre le queda el recurso 
de hallar un aspecto del experimento realizado que podría haber sido la causa del fracaso. 


He hecho esta consideración con el fin de aclarar al estudiante que el caso que acabo de describir 
no ejemplifica un punto débil del método de afirmación del consiguiente, sino más bien una 
debilidad por pare de aquellos que lo practican. La utilidad de este procedimiento como método 
para comprobar una teoría se ve limitada por el grado de especificación del planteo teórico en 
cuestión. Resulta insensato evaluar una teoría mediante la afirmación del consiguiente cuando los 
planteamientos básicos de la teoría en cuestión están sujetos a equívocos. De un modo parecido, 
no puede usarse tampoco para evaluar datos obtenidos bajo condiciones insuficientemente 
comprendidas. Debido a todo ello, la poco rigurosa teorización a la que muchos de nosotros 
hemos estado afiliados, ha servido para ocultar la principal fuerza de la técnica de afirmación del 
consiguiente. Cuando alguien aplica con éxito esta técnica de replicación sistemática, se acrecienta 
con confianza, no sólo en la fiabilidad y generalidad de los datos, sino también en su comprensión 
de los mismos. Cuando su aplicación no tiene éxito, o sea, cuando no se logra la replicación, debe 


rechazarse, o bien los datos, o bien su interpretación, o ambas cosas a la vez. No hay en ello 
posibilidad de equívocos, puesto que los casos negativos son determinantes. Una cita de Polya 
describe esta situación con grana cierto: 


Al comprobar alguna consecuencia de una ley general aún no verificada, por medio de una nueva 
observación, el matemático, así como el naturalista, dirigen esta pregunta a la Naturaleza: “sospecho que 
esta ley es cierta, ¿lo es?” Si la consecuencia se verifica claramente, hay algún indicio de que la ley en 
cuestión quizá lo sea. La Naturaleza puede contestar Sí o No por igual, pero mientras que la primera 
respuesta la susurra, la segunda la ruge. Su Sí e s provisional, su No es definitivo (63, página 10). 


El científico que pretenda utilizar la técnica de afirmación del consiguiente para evaluar ya sean 
datos o teorías, debe mostrar una disposición correspondiente para atenerse a las estrictas reglas 
que impone el método. Si no lo hace así, demuestra su propia incapacidad, no la del método. 


EL DISEÑO DE LA REPLICACIÓN SISTEMÁTICA 


Las técnicas de replicación sistemática que he citado no constituyen en absoluto una clasificación 
exhaustiva, ni es siempre posible separar entre sí, de un modo claro, los distintos métodos. Por el 
contrario, existen muchas variaciones y combinaciones posibles. ¿Cómo debe decidir el científico 
qué método, o qué combinación de métodos, debe emplear? ¿Existe algún conjunto de normas 
que pueda seguir en un caso concreto y estar seguro de que ha elegido el camino correcto? 
La respuesta a esta pregunta es negativa, puesto que la replicación sistemática no constituye un 
proceso lógico, y ni siquiera bien definido. Hay pocos científicos que realicen un experimento con 
el fin deliberado de llevar a cabo una replicación sistemática. He dado un nombre al proceso, 
aunque en gran medida es artificial. La replicación sistemática, inestimable y necesaria como es al 
progreso científico, surge en gran parte como subproducto del interés del investigador en su 
objeto de estudio. 


El investigador que trabaja en los campos más avanzados realiza experimentos a fin de analizar los 
fenómenos naturales y determinar sus relaciones mutuas. Explora los fenómenos de más interés 
para él en todas sus ramificaciones posibles. En sus experimentos individuales atiende a los más 
pequeños detalles, en pos del análisis más refinado posible. En su plan de investigación global, 
tiene presente una concepción más amplia dentro de la cual sus hallazgos experimentales deberán 
situarse eventualmente en el lugar que les corresponda. Un investigador que responda a esta 
descripción lleva a cabo un programa experimental coherente y bien integrado, en el cual la 
replicación sistemática tiene lugar de un modo natural, y, con frecuencia, sin que él se lo haya 
propuesto deliberadamente. La replicación sistemática acompaña inevitablemente a la 
experimentación sistemática, en la cual se ha alcanzado un control adecuado tanto sobre las 
variables independientes como dependientes. Cuando se descubre que un fenómeno posee 
características que permiten usarlo como línea de base, el investigador no se para a planear 
deliberadamente una serie de experimentos orientados a demostrar su replicabilidad por medio 
de la técnica de línea de base. Por el contrario, utiliza el fenómeno en cuestión como línea de 
base, dado que sospecha que resultará útil para dilucidar los efectos de otras variables 
relacionadas. 


El hecho de que la replicación sistemática tenga lugar como subproducto de un interés más básico 
en los fenómenos naturales en sí mismos, no reduce su importancia. Traigo esto a colación 
simplemente para resaltar que no pueden existir reglas explicitas para determinar la técnica de 
replicación más apropiada. El método a emplear deberá seleccionarse a partir de las opciones 
posibilitadas por los datos experimentales y por las técnicas de control de que se disponga. 


Hay, sin embargo, una propiedad común a todas las técnicas de replicación sistemática, 
consistente en que todas requieren la utilización de un cuerpo de conocimientos preexistente. 
Este conocimiento puede consistir simplemente en un repertorio de habilidades utilizadas en el 
control de la conducta, o puede también tomar la forma de un cuerpo sistemático de datos, y 
principios mutuamente relacionados. No es posible replicación sistemática de ningún tipo sin estas 
habilidades y datos. De hecho, la madurez de una ciencia puede juzgarse, en parte, por la medida 
en que la replicación sistemática establece la fiabilidad y generalidad de sus datos. Una psicología, 
por ejemplo, cuyos investigadores no tengan un control adecuado de su dato primario, es decir, la 
conducta, será incapaz de utilizar la replicación sistemática de un modo mínimamente extensivo. 
Además, el psicólogo que no permita que sus hallazgos experimentales determinen el curso de su 
programa de investigación nunca descubrirá la utilidad y elegancia de la replicación sistemática, 
puesto que este método no es apropiado para un programa experimental confeccionado a trancas 
y barrancas. El hecho de que un científico utilice la replicación sistemática para consolidar sus 
descubrimientos, constituye en sí mismo una garantía de su integridad científica, puesto que ello 
indica que, científicamente hablando, sus satisfacciones se derivan de sus datos, y que permite 
que éstos, y no consideraciones externas, determinen su programa experimental. 


SECCIÓN 1! 
Variabilidad 


A pesar de que sus leyes generales sólo pueden verificarse en el laboratorio con aproximación, el 
objeto de estudio de la física clásica fue considerado constante. La variabilidad observada en los 
experimentos solía atribuirse a errores de medida de los cuales eran responsables el 
experimentador y los instrumentos. Aunque a medida que se ha dispuesto de más, y más 
adecuados datos, este punto de vista ha ido alterándose, ha resultado ser, también, de suma 
utilidad. El refinamiento de las técnicas experimentales y la consiguiente reducción del error 
experimental en muchas áreas de la física han posibilitado la confirmación de leyes naturales con 
un notable grado de precisión. Cuando los descubrimientos efectuados por científicos 
responsables han mostrado discrepancias, ha resultado más acertado formular principios y leyes 
nuevas antes de considerar los datos discrepantes como mero producto de la variabilidad. 


La psicología ha adoptado en general un modo de operar distinto. La mayor parte de los 
psicólogos admiten la premisa de que, aparte de la variabilidad que comporta el error 
experimental, su objeto de estudio es intrinsecamente variable. Como consecuencia directa de 
este presupuesto, la estadística ha sustituido a la replicación como método para la evaluación de 
datos. Aún reconociendo las limitaciones de esta evaluación estadística, muchos psicólogos la 
justifican alegando la inexistencia de un método mejor para enfrentarse con un objeto de estudio 
tan recalcitrante. Éste enfoque ha obtenido un considerable apoyo empírico en psicología, del 
mismo modo que el opuesto lo ha recibido en física. La doctrina que defiende la variabilidad 
intrínseca de la conducta ha parecido sólida hasta hace poco tiempo y debido a ello los datos que 
han centrado sistemáticamente el interés general se han obtenido, en gran medida, en 
experimentos efectuados dentro de este enfoque. El que esos datos continúen siendo útiles a una 
ciencia de la conducta dependerá de las alternativas disponibles. 


La evidencia experimental no ha demostrado todavía que el presupuesto de variabilidad intrínseca 
en la conducta sea falso, e incluso puede que nunca llegue a probarse, puesto que es muy difícil 
demostrar una proposición negativa. No puede decirse, sin embargo, que a psicología haya llegado 
ya a sus límites máximos de precisión en sus técnicas de medida y control, y antes de que 
podamos aportar un caso convincente que pruebe la variabilidad intrínseca de la conducta, es 
necesario alcanzar un nivel de precisión técnica mucho más alto. Mientras tanto, la aceptación 
prematura de la variabilidad intrínseca como propiedad fundamental de la conducta ha conducido 
a adoptar diseños experimentales cuya misma naturaleza impide efectivamente ahondar en la 
investigación de los problemas. El diseño experimental estadístico toma la variabilidad como 
punto de partida para la evaluación de datos, y aunque la variabilidad puede medirse o incluso 
tomarse como dato, no es posible eliminarla sin destruir irremisiblemente la estrategia 
experimental. 


Tal como aclararan un análisis de algunos de los tipos y fuentes de variabilidad, y la mención de 
varios diseños experimentales que se derivan de este mismo análisis, existen alternativas a la 
estrategia general predominante. La más importante consiste en tratar las variaciones como 


ejemplo de regularidad, más que como ejemplos de caprichosidad de la naturaleza. Si un enfoque 
de este tipo resulta efectivo, la doctrina de la variabilidad natural resultará severamente limitada. 
Para tratar cualquier ejemplo de variabilidad como manifestación de un proceso regular, debemos 
no sólo identificar el origen de dicha variabilidad sino también controlarlo. Cada vez que este 
control se consigue, la variabilidad intrínseca pierde un punto de apoyo. La consecuencia más 
inmediata para el que utilice esta táctica será una insatisfacción creciente hacia muchos datos de 
la psicología experimental. A medida que la noción de variabilidad intrínseca se convierta en una 
base más y más limitada para la acción en el laboratorio, el cuerpo total de datos experimentales 
basados en dicha noción perderá cada vez más relevancia para la comprensión del objeto de 
estudio del investigador. Aunque ello no deba representar ningún problema serio para los 
estudiantes, que siempre están a punto de romper con la tradición y empezar de nuevo, sin duda 
resultará penoso para aquellos de nosotros que pretendemos ser maestros, y probablemente nos 
resistamos a descartar datos que han sido recogidos con notable esfuerzo por nosotros mismos o 
bien por nuestros maestros, colegas y contemporáneos. 


Mi breve comparación del distinto tratamiento que se da a la cuestión de la variabilidad en física y 
psicología no tiene por objeto llegar a la conclusión de que la segunda deba imitar a la primera. 
He expuesto este contraste, con el único fin de clarificar la situación actual en que se haya la 
psicología. El concepto de constancia usado en la física clásica puede incluso ser considerado como 
un error que la psicología no debería repetir, puesto que la física moderna se halla inmersa en un 
campo de fenómenos en el que la variabilidad es la regla general. Sin embargo, importa recordar 
que este cambio de enfoque no fue una cuestión de filosofía, sino que fueron los propios datos lo 
que lo forzaron, a la vez que los datos que condujeron a dicho cambio nunca se hubieran podido 
obtener de haber aceptado desde un buen principio la idea de variabilidad natural. El camino de la 
variabilidad intrínseca fue admitido sólo después de que los errores de medición hubieron sido 
reducidos hasta hacerlos cuantitativamente insignificantes, y de que la exploración de posibles 
factores determinantes hubo fracasado en eliminar la variabilidad. Pocos psicólogos argúirían que 
su ciencia ha alcanzado un nivel de refinamiento similar, y por consiguiente queda mucho camino 
por andar antes de poder concluir con seguridad que la variabilidad observada en un experimento 
dado es irreductible. 


V. Variabilidad intrínseca y variabilidad impuesta 


Supongamos que admitimos que la variabilidad no es intrínseca a la conducta. ¿De qué concepción 
alternativa disponemos para explicar el hecho de que se observa variabilidad? Si la variabilidad no 
es una propiedad natural de la misma conducta, la única posibilidad que nos queda es la de 
aceptar que, en realidad, imponemos la variabilidad a la conducta por medio de nuestras 
operaciones experimentales. 


Si la variabilidad es impuesta en lugar de intrínseca, entonces puede explicarse a través de 
demostraciones en las que la variabilidad se elimine mediante manipulaciones experimentales. 
Una vez que los factores responsables de un caso cualquiera de variabilidad hayan sido 
identificados, este caso particular deja de existir. Se elimina del reino del indeterminismo y pasa a 
ocupar su lugar dentro del cuerpo creciente de relaciones funcionales conocidas entre los 
fenómenos conductuales y los factores relevantes que los controlan. La identificación 
experimental de un foco de variabilidad implica automáticamente un control experimental, y una 
vez que éste se ha conseguido, cualquier caso posterior que se produzca de la variabilidad en 
cuestión debe imputarse al experimentador, no a su objeto de estudio. 


VARIACIONES TRATADAS COMO EJEMPLO DE ORDENACIÓN 


El hecho de que la variabilidad ha sido impuesta a los datos se demuestra mediante la 
manipulación experimental de los factores que se supone han producido las variaciones. 


Así, por ejemplo, después de haber establecido una línea e base conductual de algún tipo en dos 
sujetos, supongamos que llevamos a cabo la misma operación experimental en cada uno. 
Podemos encontrarnos con que la línea de base de cada sujeto cambia, pero haciéndolo en 
sentidos opuestos. El análisis estadístico puede conducirnos a concluir que la operación 
experimental no tuvo un efecto mayor que el que hubiera podido ejercer el azar. Sin embargo, 
recordando la advertencia de Boring de que el azar, planteado de este modo, es simplemente un 
sinónimo de ignorancia,** preferimos enfocar los datos de un modo distinto. Nuestra propia 
interpretación es que la operación experimental a veces tiene un efecto y otras veces el opuesto, 
dependiendo de otros factores que actúan en el experimento. El problema reside ahora en 
justificar esta interpretación. 


El método más simple consistiría en buscar diferencias que previamente hubieran pasado 
desapercibidas en la conducta de línea de base de ambos sujetos. Supongamos, por ejemplo, que 
nuestro dato a observar es la tasa de respuesta, y que la línea de base consiste en una tasa estable 
mantenida por un programa de reforzamiento determinado. Tal vez, al examinar de nuevo la 
conducta de línea de base, nos encontraríamos con que las tasas de respuesta de los dos sujetos 
no fueron idénticas. Ello nos podría conducir a sospechar que la tasa de respuesta de línea de base 
es el factor crítico causante de la variabilidad entre sujetos. Quizás nuestra operación 
experimental hace decrecer las tasas de respuesta altas y aumenta las tasas bajas. Una de las 


formas que podría tomar esta relación se ilustra en la figura 11. Vemos que hay una tasa de 
respuestas de línea de base, X, que no se ve afectada por la operación experimental. Las tasas de 
línea de base que se sitúan por debajo de este punto aumentan con la variable independiente, 
mientras que las que se sitúan por encima del punto de igualdad decrecen. 


Podemos emplear uno de dos procedimientos, o ambos, para comprobar nuestra sospecha de que 
un proceso como el ilustrado en la figura 11 es el causante de la diferencia entre los dos sujetos. El 
primer método consistiría en experimentar con más sujetos, y observa si hay una correlación entre 
la tasa de respuestas de línea de base y la dirección del cambio inducido por la variable 
independiente o manipulada. Una correlación baja podría, sin embargo, conducir a engaño, 
debido al tipo de variabilidad que entra en escena a otro nivel. Lo que resulta ser una alta tasa de 
respuesta para un sujeto, al medirla según los efectos de nuestra operación experimental, puede 
muy bien constituir una tasa baja para otro sujeto. Otro modo de exponer esta consideración es 
que la localización del punto de igualdad que aparece en la figura 11 puede variar entre sujetos 
distintos, y, debido a ello, la misma tasa de respuesta de línea de base quizá aumente en un sujeto 
y disminuya en otro. Dependiendo de la magnitud y distribución de este segundo tipo de 
variabilidad dentro de nuestra población de sujetos, podremos, o no, observar el tipo de 
correlación que buscamos. 
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FIGURA 11. Datos hipotéticos mostrando cómo el efecto de una operación experimental sobre la 
tasa de respuesta puede depender de la tasa de respuesta utilizada en la línea de base a partir de 
la cual se mide el cambio. 


El segundo método de explorar el foco de variabilidad implica la manipulación directa de la 
conducta de línea de base de nuestros sujetos originales. Si podemos esclarecer nuevas líneas de 
base, en las cuales los dos sujetos intercambien continuamente sus posiciones relativas con 
respecto a la tasa de repuesta, quizá muestren también efectos invertidos ante la operación 
experimental. Ello no implica ningún problema estadístico, puesto que lo que se requiere es 
simplemente una tecnología conductual suficientemente desarrollada para proporcionarnos la 
destreza experimental necesaria para manipular la conducta de nuestros sujetos a los niveles 
deseados. De hecho, deberíamos disponer de diversos métodos para alterar las tasas de 
respuesta. Sólo de este modo podremos valorar el grado en que el efecto de nuestro experimento 
original está en función de la tasa de respuestas per se, independientemente del método que 
hayamos utilizado para generarla. Sí, usando nuestros dos sujetos, somos capaces de invertir el 
efecto de la variable independiente a voluntad, simplemente manipulando la tasa de respuesta de 
línea de base, nuestro experimento constituirá una demostración palpable de variabilidad 
impuesta. 


¿Qué habría sucedido si se hubiese realizado el experimento original conforme a un diseño 
tradicional estadístico de grupo? Planteemos un experimento de este tipo y examinemos las 
posibilidades. En primer lugar seleccionaremos un grupo de sujetos grande, siguiendo algún 
procedimiento de tipo aleatorio, y procederemos a establecer la línea de base conductual a partir 
de la cual deberemos medir los efectos de nuestra operación experimental. Después que la tasa 
de respuesta de la línea de base se estabilice con respecto a valor medio y a la varianza del grupo, 
pasaremos a introducir la variable independiente. El lector recordara que el efecto de la variable 
independiente estará en función de la conducta de línea de base, pero esto el experimentador no 
lo sabe. Su manipulación experimental hará decrecer la tasa de respuesta e aquellos sujetos cuya 
línea de base es alta, y hará aumentar la de aquellos sujetos cuya línea de base es baja. Los datos 
resultantes, por lo tanto, dependerán de la distribución de la población de sujetos con líneas de 
base altas, bajas e intermedias. 


La figura 12 ilustra tres de las numerosas distribuciones poblacionales posibles. En el apartado A 
vemos una distribución bimodal de tasas de línea de base. ¿Qué aspecto tendría nuestra 
agrupación de datos si fuera ésta una fiel representación de la población de la cual extrajimos 
nuestros sujetos? La manipulación experimental haría aumentar la tasa de respuestas en lo 
sujetos con una tasa de línea de base baja, y la haría disminuir en los que la tuvieran alta. Puesto 
que la distribución es simétrica, respecto al valor medio, no habría cambio alguno en la tasa de 
respuestas media del grupo, aunque quizás se produjera una disminución en la variabilidad entre 
sujetos. Podría concluirse fácilmente que la operación experimental no tuvo un efecto significativo 
desde un punto de vista estadístico. Si, de todos modos, hubiera una marcada preponderancia de 
sujetos con una línea de base baja en la población, tal como se representa en el apartado B, un 
análisis estadístico podría llevar a la conclusión de que la misma operación experimental hace 
aumentar la tasa de respuesta. Con una distribución cuya moda se sitúe en la región de tasas altas 
(apartado C), la conclusión que se saque quizá sea la opuesta, dado que la mayor parte de sujetos 


mostrará una tasa de respuestas disminuida como consecuencia de la aplicación de la variable 
independiente. En ninguno de estos casos la generalización sería correcta. 
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FIGURA 12. Tres modos posibles de distribuir tasas de respuesta de línea de base de distintos 
valores entre un población de sujetos. 


El experimento original, sin embargo, llevado a cabo con sólo dos sujetos, está sujeto a un error 
semejante al que acarrea el sesgo de la población. Si, por ejemplo, la distribución de la población 
tuviera un máximo en la región de las líneas de base bajas, habría una gran probabilidad de que 
ambos sujetos fueran extraídos de esta región. Ambos hubieran mostrado un aumento en la tasa, 
lo cual hubiera parecido justificar una generalización incorrecta. 


Desgraciadamente, esta posibilidad se utiliza con frecuencia para justificar datos de grupo frente a 
los obtenidos en un reducido número N de experimentos. Una muestra pequeña quizá no incluya 
todas las variaciones que existen dentro de la población. A pesar de todo, hay siempre la 
posibilidad de que los extremos no se hallen representados en la muestra, y que los datos 


obtenidos a partir de estos casos relativamente especiales sean generalizados al resto de la 
población. Tales temores están lejos de ser infundados, pero, ¿debe resolverse el problema 
mediante el estudio de datos agrupados? El estudiante debe darse cuenta de que la agrupación de 
datos no sólo es incapaz de resolver este problema, sino que en realidad cierra los caminos que 
podrían conducir a su solución. Tal como he indicado anteriormente, la agrupación de datos nunca 
revela ni elimina la variabilidad de una población. En un caso como el que hemos estado 
discutiendo, y donde el factor responsable de la variabilidad se halla distribuido de un modo no 
uniforme dentro de la población, la técnica de datos agrupados impedirá incluso que llegue a 
reconocerse la existencia del problema. 


Es éste un problema de diferencias en las relaciones funcionales entre la conducta de un cierto 
número de individuos y un conjunto de variables que la controlan. A menos que se abandone la 
estadística de grupos y se examinen los datos obtenidos en sujetos individuales, no se obtiene 
ninguna ventaja en aumentar el valor de N. Y, si los datos individuales se utilizan de este modo, el 
experimento de “grupo” se transforma en un diseño basado en la replicación, directa entre 
sujetos, tal como se describió en el capítulo 3. Ello nos proporciona la clave a la solución del 
problema. 


El único modo en que puede detectarse el sesgo de una población del tipo que nos ha estado 
importunando, es a través de la replicación, directa o sistemática, llevada a cabo con sujetos 
individuales. Las medias de grupo pueden replicarse un número infinito de veces, pero el sesgo de 
la población nunca se revelará a sí mismo, puesto que también será replicado, con lo cual sólo se 
conseguirá que la variabilidad natural quede más firmemente “consolidada”. Nos hallamos aquí 
ante un caso en el que la replicación de medias de grupo sólo puede servir para perpetuar un 
error, mientras que la replicación entre sujetos individuales es inevitablemente autocorrectiva. 
Si la posibilidad de error no puede eliminarse, el camino más prudente a seguir es el de utilizar 
procedimientos que eventualmente sean capaces de detectar el error. 


Volviendo a nuestra demostración de variabilidad impuesta, podemos señalar que, de hecho, 
hemos avanzado mucho con este experimento hipotético. Cuando invertimos la conducta de línea 
de base de nuestros dos sujetos, también invertimos el sentido de su reacción a la operación 
experimental. Mediante esta técnica, no sólo pusimos de manifiesto y controlamos un foco de 
variabilidad en los datos, sino que también llevamos a cabo una replicación sistemática que 
aumento grandemente nuestra confianza en la fiabilidad y generalidad de los hallazgos. Pudimos 
tomar los datos, aparentemente discrepantes de los dos sujetos, y, manipulando el foco de 
variabilidad, nos fue dado mostrar que los datos discrepantes constituían, de hecho, dos puntos 
situados a lo largo de una misma línea continua. Controlando un foco de variabilidad hemos 
aumentado, pues, nuestra confianza en la fiabilidad de ambos conjuntos de datos al parecer 
contradictorios, y la técnica de replicación empleada es una variante del método de afirmación del 
consiguiente. 


En el proceso de unificar conjuntos de datos aparentemente discrepantes, también extendemos 
considerablemente la generalidad de los hallazgos. La prueba definitiva de generalidad es la 


replicación, y lo único que puede impedirla son los focos de variabilidad desconocidos o 
incontrolables. En el caso hipotético que nos ocupa, disponemos ahora de un principio mediante 
el cual podríamos explicar, e incluso eliminar, parte de la variabilidad que nuevos sujetos tal vez 
mostraran en los intentos de replicación. En cierto sentido, hemos aumentado la generalidad de 
nuestros datos, aún antes de intentar llevar a cabo cualquier replicación adicional. 


Seguir la pista a los focos de variabilidad e identificarlos constituye, pues, una técnica primaria 
para establecer la generalidad de los datos. Generalidad y variabilidad son, básicamente, 
conceptos antitéticos, de modo que, si en un conjunto dado de datos hay importantes focos 
ocultos de variabilidad, cualquier intento de establecer la generalidad de un sujeto o de un 
principio, muy probablemente fracasará. Cada vez que descubrimos y llegamos a controlar un 
factor que contribuye a la variabilidad, aumentamos la probabilidad de que nuestros datos 
resulten reproducibles utilizando nuevos sujetos en situaciones distintas. La experiencia nos ha 
enseñado que la precisión en el control conduce a una más amplia generalización de los datos. 


A veces se arguye en sentido contrario, y se mantiene que cuanto más estrictamente controlemos 
nuestra situación experimental, tanto menos aplicables serán nuestros datos en cuestiones 
distintas. Una forma extrema de esta postura es la argumentación, oída con frecuencia, de que los 
datos conductuales obtenidos en el laboratorio son demasiado restringidos para poderlos 
generalizar al mundo real, donde se debe tratar con gran cantidad de variables. Esto implica una 
concepción, básicamente errónea, de la técnica de eliminar la variabilidad a través del control 
experimental. El control de una variable no implica que ésta haya sido pasada por alto, dado que 
el tipo de control experimental más perfecto de una variable no se consigue eliminándola. 
De hecho, esto sólo es posible en raras ocasiones. El control experimental se consigue 
manipulando deliberadamente las variables de un modo sistemático, para que así se puedan 
comprender sus efectos. No hay, pues, ninguna ventaja en usar el mundo “real” como laboratorio 
si las variables implicadas en la experimentación tienen consecuencias pobremente definidas, o, 
como suele ser el caso, si ni siquiera se conocen. La variabilidad resultante de nuestros datos, 
probablemente sea mayor que los efectos producidos por los factores sobre los cuales se centra 
nuestro interés inmediato. La investigación experimental de los focos de variabilidad en nuestros 
datos conduce a una mejor comprensión de los fenómenos que investigamos. La aceptación de la 
variabilidad como inevitable o, en algún sentido, representativa del “mundo real”, constituye una 
filosofía que conduce a pasar por alto factores relevantes. Cuando en una investigación topamos 
con una amplia variabilidad, una norma prudente es suponer que se halla implicada, en el 
fenómeno bajo estudio, una variable “amplia” (o conjunto de variables), y si las diferencias entre 
los datos obtenidos en varios sujetos son tan considerables como para oscurecer los efectos de un 
factor manipulado deliberadamente, es probable que el experimentador haya cometido un error 
de apreciación al orientar su investigación. Debido a ello, le saldrá más a cuenta cambiar de 
dirección y examinar los factores cuyos efectos aparecen tan marcadamente en sus datos. Es éste 
un método, repetidamente comprobado, para descubrir variables importantes. 


Volvamos una vez más a nuestro experimento hipotético, en el cual se lograron reducir las 
diferencias entre sujetos mediante la manipulación de un foco de variabilidad importante. Podría 


objetarse que nuestro análisis de la variabilidad entre los dos sujetos de este experimento, 
únicamente obtuvo un éxito aparente, dado que nuestra explicación de la variabilidad producida 
por la operación experimental sólo se hizo con referencia a la variabilidad a distinto nivel — el de la 
conducta de línea de base. ¿Por qué razón, si los organismos fueron tratados del mismo modo, 
mostraron diferencias en la conducta antes de la introducción de la variable experimental? ¿Puede 
ser ésta la puerta por la que se cuela la variabilidad intrínseca? 


Antes de continuar con esta cuestión, debo llamar la atención sobre el hecho de que el problema 
es irrelevante para nuestra evaluación del experimento original. Hemos demostrado, en nuestro 
ejemplo, que la diferencia original entre los sujetos estaba sometida a leyes, y era susceptible de 
ser manipulada mediante operaciones especificables y repetibles. Esta diferencia no puede 
atribuirse ya a ningún tipo de variabilidad intrínseca en los efectos de nuestra manipulación 
experimental, y los datos deben ser considerados como fruto de alguna regularidad y no del azar, 
dado que su evaluación ha sido llevada a cabo mediante una manipulación experimental en lugar 
de estadística. La variabilidad de línea de base resulta problemática sólo si nuestro interés 
experimental está centrado en la línea de base como problema en sí misma, o si nos preocupa el 
problema de la variabilidad per se. En este caso, el problema de si la línea de base es 
intrínsecamente variable se transforma en un punto relevante por derecho propio, 
independientemente de los datos que se obtengan posteriormente con dicha línea de base. Lo 
que ahora se requiere es una comprobación experimental de la naturaleza de la variabilidad de 
línea de base, con vistas a determinar si ha sido impuesta, o si, por el contrario, es intrínseca. 


¿Cómo se debe proceder para evaluar la variabilidad de línea de base? Uno de los métodos 
posibles consistiría en examinar la historia conductual de los organismos en cuestión. Uno de ellos, 
por ejemplo, puede haber estado expuesto a una situación experimental (o incluso a una situación 
incontrolada) en la que se instauró eficazmente una conducta espaciada de una tasa de emisión 
muy baja. Tal vez esta forma efectiva de conducta persistió bajo las condiciones que manipulamos 
para generar la conducta de línea de base, resultando de ello una tasa baja de respuestas. Igual 
que antes, podemos explorar las distintas posibilidades mediante la manipulación sistemática de 
las variables que sospechamos sean relevantes. Por ejemplo, podríamos exponer deliberadamente 
nuestros sujetos a los factores que sabemos generan una conducta eficientemente espaciada, y así 
elaborar, de un modo deliberado, una historia conductual especificable. Podemos pasar a 
establecer, a continuación, nuestra línea de base experimental y observar si la tasa de respuesta 
es, en realidad, una función de este factor histórico particular. Si se observa una relación 
funcional, podremos acudir a la replicación sistemática, generando historias similares de 
conductas eficientes mediante distintas operaciones experimentales. El éxito de nuestros intentos 
constituiría una victoria completa de la variabilidad impuesta sobre la intrínseca. Aun en el caso de 
que fuéramos incapaces de identificar la historia particular causante de la variabilidad de línea de 
base observada en nuestro experimento original, no deberíamos buscar el núcleo de la explicación 
en factores desconocidos o aleatorios por más tiempo, sino en otros factores potencialmente 
identificables y reproducibles. No podremos, en este caso, apelar a ningún nivel distinto de 
variabilidad. 


Existe siempre la posibilidad de que la manipulación de la historia conductual del sujeto pueda 
fracasar en el intento de revelar los focos de la variabilidad de línea de base. En este caso, 
podemos recurrir a un tipo de análisis más sutil. Ninguna línea de base es tan simple como tienden 
a hacerla parecer nuestras descripciones. Al describir cualquier fenómeno natural, y la conducta es 
sólo un ejemplo, siempre simplificamos, abstrayendo aquellas características que siguen una 
regularidad y son susceptibles de integración sistemática. Así, cuando nos encontramos con que 
las especificaciones, de una muestra conductual, que hemos elegido para su abstracción 
presentan una variable con nuestras manipulaciones experimentales, probablemente tengamos 
razón al dudar de la idoneidad de nuestra selección. 


Quizá, por ejemplo, nuestra especificación original de la conducta de línea de base no se ha hecho, 
tradicionalmente, con relación a la tasa de respuesta, sino refiriéndola a la frecuencia de 
reforzamiento. En el caso de la conducta mantenida por un programa de reforzamiento de 
intervalo variable, solemos especificar, al describir la línea de base, solamente el tiempo medio 
entre reforzamientos. Sin embargo, pueden satisfacerse las exigencias de una cinta programadora 
de intervalo variable con una amplia variedad de tasas de respuesta. Así, podemos encontrarnos 
con que una manipulación experimental, cuyos efectos solamente siguen una relación 
desordenada con la frecuencia de reforzamiento, quedará perfectamente interpretada e integrada 
al relacionarla con la tasa de respuesta. 


Un excelente ejemplo de un caso como éste puede encontrarse en un experimento llevado a cabo 
por R. J.Herrnstein.? Este investigador utilizó tres palomas como sujetos experimentales, y 
mantuvo en ellas la conducta de picar sobre un disco mediante un programa de reforzamiento con 
comida de intervalo variable. La operación experimental consistía, en parte, en interrupciones 
ocasionales del experimento. Estas interrupciones se llevaban a cabo apagando la iluminación del 
espacio experimental y desconectando al mismo tiempo el disco sobre el que pica ba el sujeto del 
mecanismo administrador de comida, de modo que no pudiera obtener reforzamiento alguno 
durante estos períodos de “time-out”.* La segunda parte de la operación experimental consistió en 
cambiar el color de la luz de disco 30 segundos antes del inicio de cada período de time-out, y llevó 
a cabo una medición de la tasa de respuesta emitida en el transcurso de este período en relación 
con líneas de base producidas por diversos programas de intervalo variable. 


La figura 13 muestra la proporción de la tasa de respuesta durante el estímulo de advertencia (A) 
con respecto a la tasa emitida en ausencia de dicho estímulo (VI). Esta proporción está 
representada como una función del tiempo medio entre reforzamientos, determinado por el 


* El término “time-out” describe un procedimiento experimental en virtud del cual se somete al sujeto a una 
situación en que se le impide emitir totalmente la conducta que se halla bajo observación, a la vez que se 
suprime la estimulación ambiental asociada a ella. Ello se consigue fácilmente con las aves dejándolas en 
completa oscuridad, mientras que otras especies requerirían técnicas distintas. Hemos creído conveniente 
dejar el término en inglés por falta de una traducción aceptable en castellano. El vocabulario inglés-español 
de términos del análisis experimental de la conducta, publicado por Víctor A. Colotla y Xóchitl Gallegos de 
Colotla, admite también esta posibilidad. (Cfr. COLOTLA, V. A. y GALLEGOS DE COLOTLA, X. Un glosario de 
términos de análisis experimental de la conducta en el idioma español. Revista latinoamericana de 
psicología, 1971, 3, 37-50) (N. del T.) 


programa de intervalo variable. Dos de los animales, S-1 y S-3, mostraron una relación similar y 
relativamente regular, dado que, a medida que aumentaba la frecuencia de reforzamientos, la 
proporción de las dos tasas de respuesta disminuía. Un análisis más completo de los datos, 
demostró que la disminución en la proporción resultaba, tanto de un aumento en la tasa de VI, 
como de una disminución en la tasa de respuestas emitidas bajo el estimulo de advertencia, lo 
cual resultó evidente cuando se introdujeron mayores frecuencias de reforzamiento. 
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FIGURA 13. Un fracaso aparente al intentar replicar una relación funcional entre los tres sujetos. 
(De Herrnstein, 42.) 


El tercer sujeto, sin embargo, discrepaba marcadamente de los otros dos. Para S-2, la proporción 
de las tasas de respuesta aumentaba conjuntamente con la frecuencia de reforzamientos. 
¿Era ello debido a la variabilidad intrínseca? Herrnstein no lo creyó así, debido a que había 
reparado en una interesante característica de las tasas de respuesta pertenecientes a S-2. En vez 
de aumentar en función de la frecuencia de reforzamientos, como era el caso en los otros dos 
sujetos, la tasa de VI de S-2 permanecía constante a lo largo de un amplio conjunto de valores de 
intervalo entre reforzamientos. Aparentemente, S-2 había desarrollado lo que se conoce como 
una “tasa cerrada”, término con el cual se describe la tasa que se ha vuelto insensible a los 


cambios en la frecuencia de reforzamientos, así como también a un cierto número de otras 


variables (ver página 175). 


A la luz de los datos, Herrnstein llevó a cabo dos tipos de operación adicionales. En primer lugar, 
intentó eliminar la tasa cerrada, y, una vez lo hubo conseguido, volvió a determinar algunos de los 
puntos originales representados en la figura 13. Luego, en vez de descartar sus datos originales, 
intentó darles consistencia mediante una especificación alternativa de la línea de base, de modo 
que en lugar de describirla en términos de frecuencia de reforzamientos, lo hizo según la tasa de 
respuesta. Cuando se volvieron a representar los datos en función de la tasa de respuesta de línea 
de base, en lugar de hacerlo con respecto a la frecuencia de reforzamientos, se obtuvieron las 
relaciones mostradas en la figura 14, mutuamente compatibles en su forma general entre los tres 
sujetos, y demostrando que la variabilidad entre sujetos original, era el resultado de una 
especificación inadecuada de las variables relevantes al proceso. 


Podemos esperar encontrarnos frecuentemente con problemas de este tipo, puesto que tal como 
he señalado ya en algún otro lugar, los psicólogos no han llegado todavía a un acuerdo sobre las 
variables cuya especificación deberá constituir los fundamentos de su ciencia. Hasta que este 
momento llegue, no podemos tratar la variabilidad a la ligera, imputándola a fuentes 
incontrolables. 
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FIGURA 14. Replicación llevada a cabo con éxito de las relaciones funcionales en los tres animales, 
después de una especificación adecuada de las variables relevantes al proceso. (Datos 
reproducidos de Herrnstein, 42.) 


EL PAPEL DE LAS RELACIONES FUNCIONALES EN LA EVALUACIÓN DE DATOS VARIABLES 


Si un caso de variabilidad no puede explicarse mediante la manipulación de la historia conductual, 
o por medio de una especificación más adecuada de las variables relevantes que actúan en el 
momento de llevar a cabo el experimento, deberemos emprender un tipo de análisis experimental 
más complejo, que consistirá en el estudio paramétrico de las variables cuya relevancia al 
fenómeno en cuestión se sospecha. La conducta es lo suficientemente compleja como para 
imposibilitar el estudio simultáneo de todas las variables relevantes. Debido a ello, y siguiendo el 
procedimiento experimental clásico, intentaremos mantener constantes todas las variables 
excepto aquellas en que estamos interesados en aquel momento. Así, cuando por medio de la 
replicación sistemática podemos demostrar la irrelevancia de ciertas variables, quedamos 
sumamente satisfechos, puesto que aumentamos, consiguientemente la generalidad de nuestros 
hallazgos, y al mismo tiempo aligeramos nuestra labor experimental. Sin embargo, en nuestra 
preocupación por el rigor científico, solemos olvidar que las variables que mantenemos 
cuantitativamente constantes no ejercen, necesariamente, un efecto igualmente constante a lo 
largo de todas las fases del experimento. 


Volviendo a nuestro hipotético ejemplo anterior (página 146), supongamos que hubiera fracasado 
el intento de explicar la variabilidad por las diferencias en la conducta de línea de base, y que la 
manipulación apropiada de las variables de línea de base, históricas o actuales, no hubiera borrado 
las diferencias entre ambos. ¿Podemos localizar el foco de variabilidad en algún factor que hubiera 
entrado en escena sólo después de introducir la operación experimental? Quizá dispongamos de 
datos que indiquen que el estado de deprivación de comida, por ejemplo, no tuvo efecto alguno 
sobre la conducta de línea de base. A pesar de ello, otros datos relacionados o una mera 
“corazonada”, pueden conducirnos a sospechar que la variabilidad se puede explicar en función 
del grado de deprivación de comida. Si nuestra suposición es acertada, deberemos considerar la 
deprivación de comida como una variable oculta, que no ejerce control sobre la conducta hasta 
que se introduce un nuevo conjunto de factores que la mantienen. 


A continuación procedemos a variar sistemáticamente el nivel de hambre en los dos sujetos, y si 
tenemos suerte en nuestra suposición, podremos obtener datos similares a los representados en 
la figura 15. Como base de referencia para evaluar estos datos, supongamos que en el 
experimento original la conducta de línea de base fue instaurada con una deprivación de comida 
en los sujetos de 24 horas, y que se mantuviera este nivel de hambre durante su exposición inicial 
a las condiciones experimentales. A efectos de ilustración, seleccionamos como medida 
conductual el número de respuestas por unidad de tiempo, o tasa de respuesta. 


Los datos hipotéticos de la figura 15 se obtuvieron el modo siguiente: En primer lugar, los animales 
fueron sometidos de nuevo a las condiciones de línea de base, y se midieron sus tasas de 
respuesta después de varios períodos distintos de deprivación de comida. Ello está representado 
por la línea horizontal, que nos indica que ambos sujeto mantuvieron una tasa de línea de base de 
cinco respuestas por minuto, a todos los niveles de deprivación. 


Acto seguido introducimos nuestra variable experimental, o independiente, y medimos de nuevo 
las tasas de respuesta después de varios períodos distintos de deprivación de comida. Observamos 
ahora que los dos sujetos desarrollan curvas características, ambas sensibles, aunque de un modo 
diferente, a la deprivación de comida. Como consecuencia de la introducción de la variable 
independiente, la tasa de respuesta de ambos sujetos aumenta en función del número de horas de 
deprivación. Así, mientras que la deprivación no era un factor que controlase el mantenimiento de 
la conducta de línea de base, entra en escena de un modo muy poderoso después de la 
introducción de una nueva variable independiente. Así, pues, cuando la conducta cae bajo el 
control de una nueva variable, también cae, al mismo tiempo, bajo el control de la deprivación. 
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FIGURA 15. Una ilustración de cómo la deprivación de comida, que no tiene influencia alguna 
sobre la línea de base conductual, puede convertirse en un factor significativo después de cambiar 
las condiciones experimentales, pudiendo también ser causa de variabilidad entre sujetos. 


Las funciones que obtenemos ahora, en nuestro ejemplo hipotético, que relacionan la deprivación 
con la tasa de respuesta, son marcadamente similares en su forma en ambos sujetos. La mayoría 
de psicólogos experimentales se darían por satisfechos consiguiendo un grado de coherencia entre 
sujetos, como el que aparece en la figura 15. Sin embargo, hay diferencias cuantitativas entre las 
dos curvas, que podrían muy bien ser las responsables de las diferencias entre sujetos que 
observamos en nuestro primer experimento. La relación entre estas funciones y nuestra 
observación original de variabilidad se pondrá de manifiesto si concentramos nuestra atención 


inmediata a aquellas tasas de respuesta obtenidas bajo un nivel de deprivación de 24 horas, 
puesto que fue éste el nivel mantenido a todo lo largo del experimento original. 


Bajo las condiciones de línea de base, establecidas con anterioridad a la operación experimental, 
ambos sujetos respondieron a una tasa de cinco respuestas por minuto. Sin embargo, en el curso 
de la operación experimental, el sujeto A disminuye su tasa hasta alcanzar un valor próximo a una 
respuesta por minuto, mientras que la tasa del sujeto B asciende hasta aproximadamente ocho 
respuestas por minuto. Así, pues, mientras la tasa de un sujeto ha decrecido, la del otro ha 
aumentado, habiéndose producido estos cambios en función de la misma operación experimental. 
Lo que no sabemos en nuestro experimento original era que, junto a la manipulación experimental 
deliberada, también introducíamos la deprivación como variable relevante. Operando de este 
modo, situábamos a cada sujeto en el punto correspondiente a 24 horas de deprivación, en su 
propia curva representante de la relación entre tasa y deprivación. Para uno de los sujetos, este 
punto correspondía a una tasa más alta que la de la línea base, mientras que para el otro la tasa 
era menor que ésta. 


Si hubiéramos utilizado un período de derivación de 60 horas, ambos sujetos hubieran mostrado, 
en función de la operación experimental, una tasa de respuesta aumentada y muy similar. Por el 
contrario, con un nivel de deprivación de doce horas, la tasa de ambos sujetos hubiera arrojado un 
valor bajo. En cualquiera de estos últimos dos casos, nunca nos hubiéramos dado cuenta siquiera 
de que había un problema, así como tampoco lo hubiéramos detectado de haber enterrado la 
variabilidad bajo una evaluación estadística. En cualquier caso, probablemente nos hubiéramos 
enredado en una falsa generalización. 


Sólo poniendo de manifiesto e investigando, hasta detectarlos, los principales foco de variabilidad, 
puede conseguirse la verdadera generalidad. Como resultado de nuestra investigación hipotética, 
nos hallaríamos en una posición adecuada desde la cual especificar de un modo más completo los 
efectos de nuestra manipulación experimental, dado que, de hecho, hubiéramos demostrado que 
los datos obtenidos con ambos sujetos del experimento original eran correctos. La gran diferencia 
observada entre los dos sujetos después de la manipulación experimental inicial, era la 
consecuencia de una diferencia entre sujetos, relativamente pequeña, en la pendiente de las 
curvas que relacionan la tasa de respuesta con la deprivación de comida. A pesar de que el nivel 
de deprivación se había mantenido constante a todo lo largo del experimento inicial, sus efectos 
sobre la tasa de respuesta no permanecieron invariables durante la línea de base y en el 
transcurso de las distintas fases experimentales. Por lo tanto, los resultados de nuestro 
experimento inicial reflejaban realmente procesos que seguían una regularidad, y no algo próximo 
al caos. Aumentando el número de sujetos y tratando estadísticamente los resultados 
combinados, no se hubiera logrado poner de manifiesto la regularidad básica de los datos. 


De nuevo, quizás hayamos podido explicar aquí la variabilidad de los datos en que estamos 
principalmente interesados, aunque ello sólo se haya podido lograr a costa de descubrir 
variabilidad a otro nivel. Si tenemos que llevar el asunto hasta el final, nos enfrentamos con el 
problema de explicar la diferencia entre los dos sujetos, con respecto a los parámetros de la 


función que relaciona la tasa con la deprivación. Nuestra solución no ha liquidado, en absoluto, la 
cuestión de si realmente existe variabilidad intrínseca en la conducta. Simplemente, hemos 
eliminado un foco de variabilidad de una elación funcional, y lo hemos alejado un paso situándolo 
en otra relación. 


El proceso podría continuar en regresión infinita, mientras quedaran variables y combinaciones de 
variables para investigar, y no hay nada inherente indeseable en esta situación. A medida que 
identificamos nuevos focos de variabilidad en experimentos sucesivos, rescatamos una porción, 
cada vez mayor, de nuestro objeto de estudio del reino de la variabilidad intrínseca. Esta regresión 
se detendrá en cualquier punto en que a) no topemos con más variabilidad; b) la variabilidad se 
reduzca hasta tal punto y sea tan poco sistemática que podamos atribuirla a variaciones 
incontroladas, pero sin importancia, en nuestras técnicas; c) se pueda demostrar de un modo 
definitivo que la variabilidad ha sido impuesta por el experimentador, o d) se descubra, en último 
término, una clase de fenómenos conductuales que realmente muestren una variabilidad 
inherente a ellos. Tal como ha sucedido en la física, esta última posibilidad abrirá nuevas y 
apasionantes áreas de investigación. Sin embargo, queda todavía un largo camino por recorrer 
antes de que ello resulte posible. Mientras tanto, hay un elevado número de otras fuentes de 
variabilidad a considerar, juntamente con métodos para atacarlas. 


VARIABILIDAD PRODUCIDA POR UN CONTROL CONDUCTUAL INSUFICIENTE 


Uno de los aspectos más descorazonadores, y a la vez desafiantes, de la ciencia conductual, lo 
constituye la sensibilidad de la conducta a un cúmulo de variables. Existen muy pocos factores a 
los que se puede exponer un organismo sin observar algún cambio u otro en sus conducta. Incluso 
en el plan experimental más riguroso, el organismo está continuamente expuesto a los cambios 
que se producen en su ambiente. Como mínimo, dichos cambios se reducirán a aquellos que 
tengan lugar como consecuencia de su propia conducta, y a variables correlacionadas con el 
período de tiempo que ésta sea expuesta a la situación experimental. En general, los cambios 
mencionados irán acompañados de variaciones en factores tales como la temperatura, humedad, 
ruidos, sueño, hambre, sed, ciclos sexuales y muchos otros. Hay, además, cambios fisiológicos 
cuya función conocida es la de regular la economía interna del organismo, pero cuyos efectos 
pueden también reflejarse en la conducta. Las variables de este tipo, a menos que sean de por sí el 
objeto de investigación, suelen considerarse en general factores “perturbadores”. 
El experimentador preferiría no tener que tomarlas en consideración dentro de un experimento 
concreto, a pesar de que pueda darse perfecta cuenta de su importancia en un esquema general 
de sistematización. Cuando puede, las elimina o estabiliza por medio del control experimental, 
aunque ello no es siempre posible, al no disponer, con frecuencia, de la habilidad necesaria, del 
tiempo disponible, ni de los recursos financieros. 


El reconocimiento de estos factores ha contribuido a la aceptación sumisa por parte de los 
psicólogos de un enfoque estadístico de experimentación. Aun admitiendo que tales factores 
puedan ser controlables, no por ello se abandona a veces esta postura, argumentando que no 


merece la pena emprender una labor y un gasto experimentales adicionales cuando pueden 
neutralizarse estadísticamente los efectos de las variables “irrelevantes”. 


Sin embargo, las variables no se neutralizan estadísticamente. Simplemente se entierran para que 
no puedan verse sus efectos. 


El razonamiento en favor de la inmovilización estadística de las variables no deseadas se basa en la 
naturaleza pretendidamente aleatoria de tales variables. En un amplio grupo de sujetos, se arguye, 
los factores incontrolados cambiarán la conducta de algunos sujetos en una dirección, y afectarán 
a los restantes en dirección opuesta. Cuando los datos de todos los sujetos sean promediados, se 
supone que la suma algebraica de los efectos de los factores incontrolados será igual a cero. 
Así, se considera a los datos compuestos como si fueran representativos de un sujeto ideal que no 
hubiera estado nunca sometido en absoluto a las variables incontroladas. 


No sólo está por demostrar la suposición de que las variables incontroladas actúan al azar, sino 
que ello es, además, altamente improbable. En el mundo conductual hay pocos fenómenos debido 
al azar, si es que en realidad hay alguno, y ello tal vez se deba principalmente a la interacción que 
continuamente tiene lugar entre la conducta y las variables que la controlan. Es frecuente que la 
conducta, cuando cambia en función de alguna variable, altere a su vez la variable, e incluso 
cuando esto no sucede, el efecto de una variable dada rara vez es independiente del estado, en un 
momento dado, de la conducta. A medida que ésta cambia, el grupo de influencia de la variable 
que la controla también cambia a su vez, lo cual es otro modo de afirmar que la conducta rara vez 
sigue una función lineal en relación con las variables de las que depende. En estas condiciones, 
aceptar como un hecho que estos procesos se deben a la acción del azar, resulta totalmente 
insostenible. 


Incluso si pueda sostenerse dicha suposición de aleatoriedad, el control estadístico no 
proporcionaría una solución satisfactoria al problema, dado que las variables controlantes 
interactúan recíprocamente no sólo con la conducta, sino también entre sí. El efecto de una 
variable dada sobre la conducta depende de las propiedades cuantitativas y cualitativas de otras 
variables que se hallan presentes al mismo tiempo, y entre las que se incluyen, tanto los factores 
que el experimentador manipula directamente, como aquellos factores “irrelevantes” que el 
investigador prefiere tomar en consideración. Incluso si variables específicas actuaran de un modo 
aleatorio en un grupo de sujetos, es altamente improbable que conjuntos de tales variables se 
combinaran de tal manera que produjeran efectos aleatorios. 


Finalmente, se ha observado el fenómeno básico de que los estados conductuales persisten 
durante algún tiempo después de haber sido retiradas las variables que los controlan. Respecto a 
esta característica de la conducta, tendré algo más que añadir en los capítulos dedicados a diseño 
experimental; sin embargo, es importante hablar aquí de este fenómeno debido al obstáculo que 
supone para el control estadístico de la variabilidad. Incluso si una variable incontrolada ejerciera 
efectos aleatorios sobre la conducta, estos efectos podrían persistir después de la desaparición de 
la variable aleatoria. Cuando ésta reaparece, o cuando otras variables la reemplazan, el estado de 
la conducta no es el mismo, debido a lo cual resulta posible que una variable incontrolada, si opera 


con una frecuencia ligeramente mayor que otras de mismo tipo, ejerza un control relativamente 
poderoso y completo sobre la conducta en cuestión. Todo lo que se requiere para que resulte así, 
es que la variable incontrolada reaparezca persistentemente antes de que se hayan desvanecido 
por completo los efectos de su última aparición. De este modo, tendrá lugar un proceso 
acumulativo por medio del cual esta variable podrá aumentar gradualmente su control, hasta el 
punto de llegar a predominar sobre otros factores. Éste es, esencialmente, el proceso implicado en 
la adquisición de la conducta “supersticiosa”.?? Se ha observado que los reforzamientos 
adventicios ocasionales, cuyos efectos sean relativamente duraderos, llegan a ejercer un control 
sobre la conducta lo suficientemente poderoso como para desbancar el efecto de las variables 
experimentales manipuladas deliberadamente. 


Ante estas consideraciones, es poco probable que, mediante la simple elaboración de un 
promedio en un grupo de sujetos, podamos eliminar de ninguna medición conductual los efectos 
de las variables incontroladas, dado que dicho promedio estará compuesto de mediciones 
individuales que reflejarán los distintos efectos aleatorios de todos los factores incontrolados que 
operan en la situación. La variabilidad incontrolada, aunque se halla oculta a simple vista, persiste 
en todos los datos, y toda evaluación de datos agrupados debe tener en cuenta esta realidad. 
Desgraciadamente, debido a que la agrupación de daos oculta dicha variabilidad, ésta no puede 
evaluarse adecuadamente. 


Ya que criticamos las técnicas tradicionales, debemos buscar, de nuevo, alternativas. 
Evidentemente, la técnica correctiva fundamental consiste en lograr un control experimental 
directo sobre tantos actores como podamos, entre los que consideremos relevantes a un 
problema experimental dado. Por otra parte, esto no es siempre factible, ni aun deseable, puesto 
que probablemente resulte técnicamente difícil y caro conseguir un control sobre todas estas 
variables. Además, aun si fuera técnica y económicamente posible alcanzar un control completo, 
no podríamos conocer, por regla general, la relevancia de todos los factores conce bibles. 


Podemos preguntarnos, por ejemplo, si el intervalo de variación de humedad, normalmente 
mantenido en el laboratorio, va a producir alguna variación importante en los datos que 
obtengamos. Controlar la humedad en ausencia de este conocimiento puede constituir un 
derroche de energía, y, a menos que la humedad sea una variable en que esté directamente 
interesado el experimentador, o cuya relevancia sistemática desee investigar, se mostrará poco 
dispuesto a organizar un programa experimental para determinar su posible importancia. Lo que sí 
hará es observar las variaciones naturales en la humedad que tenga lugar, y observar luego si 
muestran una correlación con sus hallazgos experimentales de modo consistente y substancial. 
Aun en el caso de que realmente observe una marcada correlación, probablemente adoptará, sin 
embargo, alguna otra medida que no sea la de instalar un costoso aparato que controle la 
humedad. 


Antes de describir el procedimiento que proseguirá el experimentador, es importante llamar la 
atención sobre una característica básica del primer paso que emprenderá. Consiste ésta en 
emplear datos individuales para determinar si la humedad es una variable que requiera un control 


expreso. Debido a sus posibles interacciones, tanto con la conducta como con otras variables, los 
efectos individuales pueden ser intensos, aunque discrepantes a la vez. Los datos promediados 
quizá oculten estas discrepancias, pero no así los datos individuales, que pondrán de manifiesto su 
magnitud e importancia. También puede ocurrir que se produzcan efectos intensos sólo en unos 
pocos sujetos, de modo que su significación estadística resulte baja a pesar de su gran importancia 
experimental. Por el contrario, los datos individuales son capaces de revelar efectos de variables 
que los datos agrupados pueden ocultar. 


Así, pues, ¿qué ocurre si averiguamos que la humedad realmente contribuye, de forma 
substancial, a la variabilidad observada en los experimentos conductuales? Variables indeseadas 
del tipo que he descrito ejercen su máximo efecto sobre la conducta que está siendo débilmente 
mantenida, y creo que ello constituye un principio lo suficientemente general como para justificar 
esta norma elemental: al toparnos con una variabilidad intolerable, debemos intensificar las 
variables que son directamente responsables de que se mantenga la conducta en cuestión. 
Por ejemplo, en el campo con el que estoy más familiarizado, se podría aumentar el nivel de 
deprivación de comida del sujeto, el tamaño del reforzamiento o la intensidad del shock, así como 
proporcionar a la conducta un feedback exteroceptivo, emplear estímulos fácilmente 
discriminables y, en general, utilizar tantas variables y combinaciones de variables como sea 
posible, de entre aquellas que se sabe que ejercen un alto grado de control conductual. En otras 
palabras, en vez de intentar manipular directamente las variables extrañas, podremos a menudo 
contrarrestar sus efectos estableciendo líneas de base que resulten relativamente insensibles a su 
influencia. 


La utilización con éxito de esta técnica para tratar la variabilidad, depende de que se disponga de 
un cuerpo de información establecido, puesto que a menos que se sepa algo de las variables más 
efectivas en cuanto al mantenimiento de la conducta a un alto nivel, será imposible eliminar la 
variabilidad indeseada mediante la técnica de intensificar el control conductual. Por consiguiente, 
el grado en que se emplea esta técnica constituye otro criterio para evaluar el progreso realizado 
en un campo determinado de la investigación científica. Los datos que muestran orden, 
incontaminados por la variabilidad debida a los factores extraños, y obtenidos por medio de 
montajes experimentales en los que tales factores no son eliminados explícitamente, indican que 
los investigadores tienen perfectamente controladas las variables más poderosas. 


El grado en que esta técnica depende del conocimiento establecido puede ilustrarse mediante un 
ejemplo. Utilizando ratas como sujetos experimentales, se diseñó un proyecto para investigar los 
efectos que ejercían las lesiones cerebrales localizadas sobre la conducta de dilación. 
Para generara la línea de base conductual seleccionamos, en primer lugar, un procedimiento que 
obligara al animal a espaciar sus respuestas de apretar una palanca, de modo que debían 
transcurrir 20 segundos como mínimo entre dos respuestas consecutivas para que éstas pudieran 
conseguir un reforzamiento en forma de comida. ** Como resultado, se produjo una tasa estable 
de respuestas espaciadas durante un período de dos horas, que sirvió como línea de base a partir 
de la cual medir los efectos de lesiones corticales producidas experimentalmente. 


Sin embargo, mucho antes de intentar siquiera producir ninguna lesión, topamos con un obstáculo 
en la vertiente conductual de la experimentación, puesto que después de mantener un nivel 
conductual estable durante la primera hora de la sesión, las tasas de respuesta de algunos 
animales se volvían extraordinariamente variables durante la segunda. Sus tasas de respuesta a la 
palanca disminuían, y los sujetos pasaban intervalos de tiempo considerables en una postura muy 
parecida a la que mantenían durante el sueño. Esta conducta, juntamente con las curvas de 
respuestas a la palanca negativamente aceleradas, sugería que los animales habían recibido un 
número de reforzadores durante la primera hora suficiente para llegar a saciarlos, situación en la 
que otras variables, distintas de las del programa de reforzamiento, pasan a dominar la conducta. 
Sin embargo, algunos datos previos de que se disponía habían demostrado que la saciedad es un 
asunto relativo, controlado por otras variables además de la cantidad de comida ingerida. 
Estos datos pueden resumirse, de un modo no muy preciso, en la afirmación de que, cuanto más 
favorable sea el programa de reforzamiento, más comerá el animal. Debido a estos 
descubrimientos, la acción que emprendimos con vistas a eliminar la variabilidad y prolongar la 
estabilidad de la conducta de línea de base, fue distinta de la acción sugerida por nuestras 
observaciones originales, a raíz de las cuales nuestra primera idea fue la de disminuir el tamaño de 
los refuerzos y de este modo retrasar la aparición de la saciedad. En realidad, lo que hicimos fue 
totalmente lo contrario, es decir, aumentamos el tamaño de los gránulos de comida. Mediante 
esta operación contrarrestamos con éxito el efecto de las variables extrañas que estaban 
interfiriendo nuestro control de la conducta de línea de base. El mayor tamaño del reforzamiento, 
en lugar de anticipar la saciedad, aumentó el control ejercido por el programa de reforzamiento, 
hasta el punto de neutralizar eficazmente las variables incontroladas. 


Indudablemente, se le habrá ocurrido al estudiante que esta técnica tiene sus limitaciones, dado 
que al aumentar la eficacia de las variables que mantienen la conducta de línea de base, es 
probable que reduzcan su sensibilidad, no sólo a las variables extrañas, sino también a las que 
constituyen el objeto principal de nuestra investigación. Así, por ejemplo, la conducta mantenida 
por ciertos programas de reforzamiento de razón fija, en los que se requiere que el sujeto emita 
un número fijo de respuestas por cada reforzamiento, resulta extraordinariamente estable y 
resistente a las influencias externas. También es muy resistente a la acción de ciertos fármacos 
que en general hacen disminuir la conducta mantenida por otros programas de reforzamiento. 
Por ello, si se está interesado en estudiar los efectos de algunas de estas drogas sobre la conducta, 
no será deseable utilizar un programa de razón fija para generar la línea de base, a pesar de su 
relativa insensibilidad a otras variables. Blough lo confirma con una aguda analogía: “Si en el 
estudio de las ondas que se producen en la superficie del agua se desea partir de una línea de base 
en la que dicha superficie se muestre totalmente lisa, sin el más pequeño rizo, es improcedente 
helar el líquido para conseguirlo ” (8, página 343). Por lo tanto, el investigador deberá emplear una 
cierta cantidad de sentido común y de exploración por ensayo-y-error al seleccionar el método 
más apropiado para poder librarse relativamente de la variabilidad indeseada, pero no debe 
cometer el error de elegir un método que insensibilice la conducta a la acción de las variables que 
se hallan bajo investigación. 


Un control conductual débil también puede ser el resultado de una selección imprudente de los 
valores cuantitativos de las variables que deben mantener una línea de base. La figura 16 ilustra 
un ejemplo potencial. En este experimento se presentaba siempre uno de los estímulos posibles, 
según fuera la conducta del sujeto (una rata blanca). En presencia del primer estímulo (S1), cada 
respuesta a la palanca por parte del animal servía para posponer la aparición del segundo estímulo 
(S2) durante 20 segundos. Cada vez que el sujeto dejaba transcurrir más de 20 segundos sin emitir 
ninguna respuesta, aparecía S2, y si el animal dejaba de responder en presencia de este estímulo, 
recibía un shock, reapareciendo, a la vez, S1. Sin embargo, cada respuesta en presencia de S2 
cumplía con la doble función de posponer el shock y prolongar la duración de este estímulo S2. 


H————— 100 RESPUESTAS 


H———— 10 MINUTOS 


FIGURA 16. El registro del centro ilustra un estado conductual que oscila entre los grados extremos 
de estabilidad representados por las curvas superior e inferior. (Datos inéditos de Sidman, 73.) 


En este estudio se halló que la conducta en presencia de S1 estaba determinada, en parte, por la 
duración del intervalo de tiempo en que cada respuesta emitida en presencia de S2 posponía el 
shock. Podemos observar en la figura 16 que la cantidad de respuestas emitidas en presencia de 
S1 disminuye a medida que aumentamos el intervalo en que la respuesta pospone el shock 
(intervalo RS) en presencia de S2. Con un intervalo RS de 10 segundos, el sujeto emite la mayor 
parte de respuestas en presencia de S1. En cambio, si el intervalo RS es de 30 segundos, 
prácticamente no hay respuestas en presencia de S1, y cuando dicho intervalo RS es de 20 


segundos la conducta en presencia de S1 es intermedia entre las dos situaciones extremas. 
Es precisamente esta curva intermedia la que más nos interesa en esta discusión. Es de notar que 
la tasa de respuesta tiene un valor doble, puesto que se alternan períodos en los que la tasa es 
relativamente estable con otros en que ésta desaparece, produciéndose en la curva zonas planas 
(mesetas) indicadoras de que no hay respuestas. La tasa estable es similar a la que aparece en la 
curva superior, mientras que las mesetas se asemejan a la curva representada en el grafico 
inferior. Por consiguiente, puede considerarse que esta conducta se encuentra en un estado de 
transición entre la alta tasa de respuesta que tiene lugar cuando rige un intervalo RS de 10 
segundos y la baja tasa asociada al intervalo RS de 30 segundos. Puede decirse, pues, que la 
conducta “titubea” entre ambas posiciones extremas. 


Este estado de transición oscilatorio constituye un ejemplo del control conductual débil que puede 
resultar cuando la manipulación experimental fluctúa entre dos valores cuantitativos de una 
variable. Sin embargo, las oscilaciones observadas no representan variabilidad aleatoria, sino que, 
debido a que la conducta está siendo mantenida en un estado intermedio entre dos extremos, 
otros factores incontrolados que también se hallan presentes en la situación actúan de forma que 
a veces empujan a conducta a un lado de la línea divisoria, y otras veces al otro. En una situación 
de este tipo, la variabilidad de línea de base puede reducirse alterando los valores cuantitativos de 
las variables que controlan la conducta, fortaleciendo así, por consiguiente, el control 
experimental. 


VARIABILIDAD PRODUCIDA POR FLUCTUACIONES LOCALES EN LAS CONTINGENCIAS QUE 
MANTIENEN LA CONDUCTA 


Ya hemos dicho que los cambios conductuales suelen persistir un tiempo considerable después de 
que las variables que las han iniciado han dejado de estar físicamente presentes. Un ejemplo muy 
conocido es la extinción, en la cual la conducta puede producirse de un modo esencialmente 
invariable durante mucho tiempo después de interrumpido el reforzamiento. Sin embargo, hay 
casos más sutiles que este. Por ejemplo, pueden producirse pequeños cambios en las 
contingencias de reforzamiento, en el curso de un experimento, que comporten efectos más 
perdurables que las fluctuaciones locales. En general, tales fluctuaciones no han sido planeadas 
por el experimentador y pueden producirse como consecuencia del método utilizado al programar 
las contingencias de reforzamiento, o bien pueden ser el subproducto de la interacción recíproca 
que tiene lugar entre la conducta y el ambiente que la controla. En cualquier caso, sus persistentes 
efectos probablemente sean la causa de gran parte de la variabilidad, tanto intrasujeto como 
entre sujetos. 


Existe, sin embargo, un método para programar experimentos que casi inevitablemente producirá 
fluctuaciones locales del tipo que nos interesan aquí. Este método se caracteriza por el uso de 
secuencias aleatorias. Por ejemplo, la serie de intervalos de tiempo que constituyen un programa 
de reforzamiento intervalo variable, puede perforarse en una cinta programadora siguiendo algún 
tipo de orden al azar. Del mismo modo, podemos presentar, siguiendo una secuencia aleatoria, 


una serie de estímulos a los cuales el sujeto debe responder diferencialmente. Esta serie aleatoria 
se emplea generalmente debido a que el experimentador desea eliminar cualquier efecto 
consistente que pudiera provenir de la propia secuencia. Así, por ejemplo, el experimento puede 
implicar dos estímulos de distinta longitud de onda, requiriéndose una respuesta distinta para 
conseguir reforzamiento en presencia de cada uno de ellos. El interés del experimentador se 
centra, pues, en la posibilidad, por parte del sujeto, de discriminar dos longitudes de onda. 
Lógicamente, no presenta los dos estímulos alternativamente, puesto que si así lo hiciera, el sujeto 
podría obtener reforzamiento alternando su respuesta con cada presentación de estímulos, 
independientemente de la longitud de onda que estuviera presente en un momento dado. Puesto 
que lo que le interesa al experimentador es que la conducta del sujeto pase a ser función de la 
longitud de onda de los estímulos, y no de la secuencia, presenta dichos estímulos de un modo 
aleatorio. 


Sin embargo, el orden aleatorio no elimina los efectos debidos a la secuencia, puesto que 
cualquier serie de acontecimientos se aproxima al verdadero azar sólo cuando sus elementos se 
presentan en gran número de ocasiones. Los segmentos locales de la serie no resultarán 
aleatorios, sino que incluirán algunas largas sucesiones de componentes únicos, algunas pautas de 
dos componentes, y así muchos otros tipos de secuencia ordenadas, no pudiéndose pasar por alto 
estas desviaciones locales del azar. La conducta está gobernada por contingencias locales, 
independientemente de si se han dispuesto adrede, a voluntad del experimentador, o si se han 
producido como fluctuaciones incontroladas en una secuencia globalmente aleatoria. Si la misma 
respuesta ha resultado reforzada cinco veces consecutivas, es altamente probable que la próxima 
respuesta resulte influenciada por esta secuencia, particularmente si los estímulos implicados 
están muy cercanos al umbral diferencial. Podemos esperar que parte de la variabilidad que 
muestra una respuesta al mismo estímulo esté en función de dichas secuencias ordenadas, y, 
mientras que en una sesión experimental dada tal vez no se produzca ningún grupo de cinco 
acontecimientos similares, en la sesión siguiente quizá se den varios casos. Es probable que una 
porción considerable de variabilidad entre sesiones se deba a estas fluctuaciones locales dentro de 
una secuencia aleatoria. 


Factores similares pueden contribuir a la variabilidad de una línea de base conductual, 
oscureciendo así los efectos de variables que se le superpongan. Un programa de reforzamiento 
de intervalo variable, por ejemplo, se utiliza comúnmente para generar una tasa estable de 
respuestas, las desviaciones de la cual proporcionarán una medida de los efectos ejercidos por 
otras variables. Según este programa, el reforzamiento se pone a disposición del sujeto después 
de haber transcurrido períodos de tiempo variables, a contar desde el último reforzamiento 
recibido. La secuencia de intervalos podría programarse al azar, pero no es probable que de este 
modo se obtuviera una tasa de respuesta estable, dado que, por ejemplo, una secuencia de 
intervalos de tiempo cortos entre reforzamientos produciría un aumento en la tasa de respuestas, 
aumento que es posible perdurara largo tiempo después de terminar la secuencia de intervalos 
cortos. Una serie de intervalos largos entre reforzamientos, por otra parte, no sólo hará disminuir 
la tasa, sino que probablemente producirá un esquema temporal de respuestas similar al que 


genera un programa de intervalo fijo. El sujeto puede cesar de responder inmediatamente 
después de recibir un reforzamiento, y a continuación acelerar su tasa gradualmente hasta la 
administración del siguiente. Incluso un animal tan inferior como la rata puede reflejar en su tasa 
de respuesta una secuencia de intervalos alternativamente cortos y largos. Tales fluctuaciones en 
una serie aleatoria de intervalos a reflejarán, por consiguiente, en las correspondientes 
fluctuaciones de la conducta. 


Una solución parcial a este problema consiste en usar, en lugar de secuencias aleatorias, una serie 
mixta de intervalos. Una serie aleatoria resultaría parcialmente confusa debido a regularidades 
locales sobre las que el experimentador no tiene ningún control, mientras que una secuencia 
mixta, pero controlada, de intervalos puede reducir los efectos de secuencia de un modo mucho 
más eficaz. El experimentador puede, por ejemplo, elaborar una secuencia en la que cada 
intervalo vaya seguido, el mismo número de veces, por cada uno de los demás intervalos de la 
serie. Si es necesario, puede hacer lo mismo con pares de intervalos, ternas, etc. Sin embargo, es 
más probable que se consigan tasas de respuesta más estables cuando algunos intervalos se 
presentan con más frecuencia que otros, dado que la tasa no es simplemente una función lineal 
del intervalo entre reforzamientos. 


Actualmente, tenemos a nuestra disposición pocos datos del tipo requerido para resolver tales 
problemas técnicos, y muchos psicólogos experimentales no han visto aún la necesidad de 
enfrentarse con dichos problemas. Se dan por satisfechos consiguiendo una estabilidad 
conductual de un tipo globalmente estadístico, en la que se pasan por alto las fluctuaciones 
locales. Debido a ello, los datos se promedian sobre varios sujetos individuales o, dentro de un 
solo individuo, sobre grupos de “pruebas” o sobre períodos de tiempo relativamente largos. 
Sin embargo, a medida que los problemas con que nos enfrentamos se vuelven más sutiles, y a 
medida que aumente nuestra comprensión de la conducta, nos veremos forzados a investigar sus 
más ínfimos pormenores, oscurecidos actualmente por variabilidad debida a fluctuaciones en las 
contingencias que mantienen la conducta. 


Debe destacarse, si es que no es ya evidente, que tal variabilidad no se puede eliminar por 
completo. La conducta, necesariamente, tiene lugar en el tiempo, y los efectos de secuencia son, 
por consiguiente, inevitables, con lo que si existe una variabilidad verdaderamente intrínseca, 
probablemente se situé en este punto. Sin embargo —y nunca se insistirá demasiado en ello—, la 
variabilidad debida a efectos de secuencia no es inherente a la conducta, sino a los factores que la 
controlan. La conducta es una función ordenada de las fluctuaciones locales que se producen en 
las contingencias que la controlan, y son las mismas contingencias las que cambian, ya sea debido 
a los caprichos de ambiente natural, ya se deba a las necesidades prácticas de la técnica utilizada 
en el laboratorio. La única solución real consiste en evaluar tales efectos, y tenerlos en cuenta en 
nuestras descripciones de la conducta, tanto teóricas como experimentales. 


Las fluctuaciones locales en las contingencias que mantienen la conducta pueden producirse en 
función de la interacción de recíproca entre aquélla y el ambiente que la controla. Los mismos 
factores que gobiernan la conducta se ven, con frecuencia, alterados por la propia conducta que 


generan, con lo que la variabilidad en la conducta puede deberse al hecho de que ésta altera los 
propios factores que la controlan. Una interacción reciproca de este tipo puede tener varios 
efectos distintos. Por ejemplo, el sistema de unión entre la conducta y los factores que a controlan 
puede resultar autorregulador, en cuyo caso se producirá un proceso cíclico. La conducta 
fluctuará, de modo más o menos regular, entre dos o más estados, probablemente con un valor 
medio relativamente constante a lo largo de un período de tiempo lo suficientemente dilatado. 
Sin embargo, en períodos cortos, la variabilidad resultará evidente, y las comparaciones entre 
distintos segmentos de una conducta se verán perjudicadas en la medida en que dichos 
segmentos se hayan extraído de estadios distintos dentro del ciclo. 


La conducta de evitación constituye un ejemplo en el que el experimentador dispone 
deliberadamente los factores de modo que la conducta cambie algunas de las variables que la 
controlan. En los experimentos de evitación, se suelen administrar shocks al sujeto siguiendo un 
programa temporal diseñado por el experimentador. Sin embargo, la respuesta de evitación altera 
este programa, puesto que cada vez que el sujeto emite una respuesta, el shock resulta 
pospuesto, con lo que disminuye la frecuencia global con que aquél recibe los shocks. Sin 
embargo, a medida que esta frecuencia de administración de shocks se reduce, la respuesta de 
evitación a su vez se debilita, hasta que llega un momento en que es incapaz de producirse a 
tiempo para evitar el shock. El shock, o los varios shocks que consiguientemente se recién, sirven 
para “bombear” la conducta, comenzando así su nuevo ciclo. Parte de este proceso se halla 
ilustrado por la curva acumulativa de respuestas que aparece en la figura 17, la cual representa un 
estadio intermedio del condicionamiento de evitación en un mono. Cada respuesta a la palanca 
por parte del mono tenía el efecto de posponer en 180 segundos la administración del shock, de 
modo que el animal lo recibía cada vez que no lograba apretar la palanca dentro de los 180 
segundos siguientes a cada respuesta. 
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FIGURA 17. Fluctuaciones cíclicas en la tasa de respuesta producidas por interacciones entre 
conducta de evitación y shocks. Los cortos desplazamientos oblicuos de la plumilla del aparato 
registrador indicas los shocks. (De Sidman, 75.) 


El registro ilustra una ciclicidad del tipo que he mencionado, en la que después de cada shock la 
tasa de respuesta es alta, con una declinación gradual subsiguiente a medida que transcurre el 
tiempo sin que se administre ningún shock. Eventualmente, la tasa disminuye hasta alcanzar el 
punto en que una pausa de 180 segundos vuelve a producir un shock, iniciándose así un nuevo 
ciclo. 


Al principio de un proceso de condicionamiento, los ciclos suelen ser, por lo general, más cortos, 
con varios shocks interponiéndose entre cada serie de respuestas. En un espacio posterior al que 
aparece en la figura 17, los ciclos se tornan extremadamente largos, de modo que algunos 
animales llegan a mantener la conducta de evitación durante decenas de horas sin recibir un solo 
shock. Así, pues, no sólo la conducta alerta la frecuencia de los shocks, sino que lo hace 
diferencialmente en distintos estadios del proceso de condicionamiento, y la propia variabilidad 
cíclica sufre, consiguientemente, un cambio ordenado. Debido a ello, es menos probable que los 
experimentos llevados a cabo en esta última fase del proceso resulten afectados por las 
fluctuaciones cíclicas. 


La interacción entre conducta de evitación y shock es de naturaleza autorreguladora, dado que, a 
medida que las respuestas de evitación reducen la frecuencia de los shocks, dichas respuestas se 
hacen menos probables, llegándose a un punto en que el sujeto vuelve a recibir shocks, 
aumentando así, de nuevo, la probabilidad de la respuesta de evitación. La conducta mantenida 
por programas de reforzamiento positivo de especificación temporal también muestra este tipo de 
variabilidad cíclica autorreguladora. En la figura 18 se representa un registro acumulativo de la 
conducta de una paloma tal como es generada por un programa de reforzamiento de intervalo 
fijo. 


FIGURA 18. Variabilidad cíclica característica de una conducta mantenida por un programa de 
reforzamiento de intervalo fijo. (De Ferster y Skinner, 34, p. 159.) 


Bajo este programa, la respuesta emitida por la paloma al picar sobre un disco iluminado puede 
obtener reforzamiento con una frecuencia de, como máximo, uno cada cuatro minutos. Después 
de la administración de cada reforzamiento, comienza de nuevo el intervalo de cuatro minutos. 
Transcurrido el cual, un nuevo reforzamiento se pone a disposición del animal. 


La conducta característica generada por este programa de intervalo fijo, cando se controlan 
apropiadamente otros factores, consiste en una tasa de respuestas positivamente acelerada, 
como la que puede verse en la figura 18, entre la mayoría de reforzamientos. Sin embargo, se 
observa que la porción horizontal de la curva que sigue inmediatamente al reforzamiento tiene 
duración variable. En ocasiones, la porción horizontal ocupa casi todo el segmento de la curva 
entre dos reforzamientos, en cuyo caso se halla ausente el típico “codo”. Tal variabilidad 
proporciona la evidencia de que existe un proceso autorregulador, dado que cuando el intervalo 
horizontal de la curva es relativamente corto, se alcanza rápidamente la tasa terminal, en cuyo 
caso el sujeto emite un número relativamente elevado de respuestas antes de conseguir el 
reforzamiento. Por consiguiente, la recompensa que recibe, en términos de reforzamientos por 
respuesta, es relativamente escasa. Uno o más de estos ciclos pobremente pagados debilitan la 
conducta, debido a lo cual se alarga la pausa de postreforzamiento, llegándose a extender, quizá, a 
todo o largo de los cuatro minutos. Estas largas pausas hacen que el animal consiga reforzamiento 
después de un número relativamente reducido de respuestas, aumentando así la recompensa, 
dada igualmente por la proporción de reforzamientos por respuesta. De este modo, la conducta 
queda fortalecida, y la pausa de postreforzamiento se acorta de nuevo. 


Observamos, pues, de nuevo, la variabilidad que resulta de un proceso continuo de ajuste entre la 
conducta y una de las variables que la controlan, y no podemos atribuir al azar dicha variabilidad. 
Cada estado por el que atraviesa la conducta se halla estrictamente determinado por factores 
antecedentes y momentáneos, y hasta que se consiga someter el proceso cíclico a un grado de 
control más satisfactorio, puede resultar necesario emplear una descripción estadística de la 
conducta. Sin embargo, la estadística evaluativa es inadecuada, puesto que una vez que los 
procesos subyacentes a la variación cíclica se especifican, la evaluación estadística no puede ni 
hacer desaparecer los ciclos ni convertirlos en más reales. Nuestros esfuerzos deberían 
encaminarse a conseguirse el control experimental suficiente para determinar si el análisis final de 
los mismos requerirá, todavía, una descripción estadística. 


La interacción recíproca entre la conducta y las contingencias que la mantienen no es siempre, 
necesariamente, un proceso autorregulador. Dicha interacción puede ser de tal naturaleza que, o 
bien produzca una completa cesación de la conducta, o bien, al contrario, la “desbloque”. Así, por 
ejemplo, la conducta mantenida por un programa de razón fija no dispone de ningún mecanismo 
de ajuste incorporado, de modo que, si hacemos que la razón de respuestas por reforzamiento 
requerida sea demasiado grande, la conducta en cuestión simplemente desaparecerá. Las razones 
grandes dan lugar a largos períodos sin respuestas, especialmente después de la administración de 
los reforzamientos. Al revés de lo que ocurre con los programas de intervalo, las pausas largas en 
un programa razón no aumentan la probabilidad de que la siguiente respuesta sea reforzada. 
Su efecto es, simplemente, disminuir la frecuencia de reforzamiento, y a medida que ésta 


disminuye, las pausas se alargan; lo cual reduce todavía más la frecuencia de reforzamientos, y 
este proceso en espiral continúa hasta que la conducta cesa por completo. 


Dependiendo del valor de la razón de respuestas requeridas por reforzamiento, la conducta puede 
desaparecer súbitamente, o bien continuar en un estado de “distensión” durante un período de 
tiempo prolongado. En este último caso, la línea de base mostrará no sólo una fluctuación 
considerable, sino que también dará lugar a resultados variables cuando se utilice para determinar 
los efectos de otros factores. Algunos fármacos, por ejemplo, no ejercen ningún efecto sobre la 
conducta de razón fija relativamente uniforme,?* pero producen profundos cambios en una 
conducta de “razón distendida”.** De nuevo nos hallamos ante algo que no es variabilidad debida 
al azar. Cuando un sujeto dado produce datos discrepantes en ocasiones distintas, o cuando se 
observan marcadas diferencias entre sujetos, o incluso cuando distintos experimentadores 
obtienen datos contradictorios, existe una gran posibilidad de que se hayan producido cambios 
incontrolados en las contingencias que mantienen la conducta. Sin embargo, se podrán controlar 
tales cambios si la conducta en cuestión se ha investigado hasta el punto de haber identificado las 
principales variables que la gobiernan. 


La variabilidad debida a un proceso que no es autorregulador, del tipo que tiende a extinguir la 
conducta, se suele identificar con facilidad, puesto que el fenómeno es, en este caso, 
directamente observable. Sin embargo, no es, en ocasiones, tan fácilmente especificable cuando el 
proceso va en dirección opuesta. Las contingencias que mantienen la conducta pueden actuar en 
el sentido de producir conducta “desbocada”, que puede caracterizarse por su alta tasa de emisión 
y su relativa insensibilidad a la manipulación por otras variables. 


Así, por ejemplo, cuando una paloma ha tenido una larga experiencia con un programa de 
reforzamiento de intervalo variable, respondiendo a una alta tasa constante, día tras día, la propia 
tasa se convierte en una característica importante de la contingencia de reforzamiento. Es decir, 
que el reforzamiento no solamente está relacionado con la respuesta de picar sobre el disco, sino 
también con un picar sobre el disco caracterizado por una tasa de emisión particular. No importa 
mucho el hecho de que la tasa de respuesta no tenga, en realidad, nada que ver con la aparición 
de la tolva de grano. El factor importante es que la presentación de la comida se ve 
persistentemente precedida por una tasa de respuesta dada, con lo que ésta resulta, aunque de 
un modo accidental, condicionada. Cuando esto ocurre, la conducta mantenida, por un programa 
de reforzamiento de intervalo variable deja de ser, desde luego, una línea de base satisfactoria a 
partir de la cual medir los efectos ejercidos por otras variables. La tasa de respuesta, condicionada 
a su vez, pierde una gran parte de su sensibilidad, y, además, es probable que los datos 
discrepantes den lugar a una controversia inútil si no se reconoce la existencia de esta 
“tasa cerrada”. 


Se ha observado, por ejemplo, que la tasa de respuesta generada por un programa de 
reforzamiento con comida de intervalo variable puede reflejar fielmente el grado de deprivación 
de comida del sujeto. No obstante, se ha podido observar más recientemente que la línea de base 
de intervalo variable resulta bastante insensible a dicha deprivación. 34 En este último caso, los 


sujetos habían sido expuestos, sin embargo, a dicho programa de intervalo variable durante un 
período de tiempo mucho más dilatado de lo que resulta normal en la mayoría de laboratorios, y, 
además, una característica del experimento consistía en la instauración, en los animales, de una 
tasa estable y relativamente alta, mediante la manipulación de otros factores. Es probable que se 
produjera una tasa cerrada, por lo que ambos hallazgos sobre la deprivación son correctos, dadas 
las condiciones particulares que regían en ambos experimentos. 


Este ejemplo pone de manifiesto un único tipo de variabilidad entre hallazgos experimentales que 
se deriva de un ciclo de interacción cada vez más acelerado entre la conducta y las variables que la 
controlan. La insensibilidad de la línea de base de intervalo variable fue observada en un 
laboratorio que se distingue por su insistencia en un control riguroso de las variables básicas, y 
donde los factores extraños resultan reducidos al mínimo, de forma característica, por el uso de 
altos niveles de deprivación, cantidades relativamente grandes de reforzamiento, discos de 
respuesta sensibles, etcétera. En consecuencia, la marcada facilidad de reproducción de la 
conducta de animales individuales constituye un distintivo de trabajo realizado en este 
laboratorio. Es altamente probable, en virtud de la estabilidad de las líneas de base utilizadas, que 
una experimentación caracterizada por un grado de rigor tan alto revele efectos en los que las 
propiedades de la conducta se conviertan, en sí mismas, en importantes factores determinantes 
de las contingencias que la mantienen. Es sólo cuando la conducta manifiesta características 
persistentes durante períodos de tiempo prolongados que puede observarse un fenómeno como 
la tasa condicionada o cerrada. Nos hallamos, por lo tanto, ante un caso poco frecuente, en que la 
insensibilidad puede deberse a un control experimental extremadamente riguroso, en lugar de ser 
producto de un control inadecuado. Por consiguiente, al evaluar hallazgos sobre los que distintos 
laboratorios están en desacuerdo, es necesario considerar las formas de operar características de 
los investigadores implicados. Mientras que las relaciones funcionales ordenadas constituyen, en 
general, una buena indicación de que se posee una técnica adecuada, siempre existe la posibilidad 
de que un control todavía mayor dé lugar a una línea de base invariable. 


Los problemas de variabilidad que se plantean cuando la conducta cae bajo su propio control no 
pertenecen, necesariamente, a aquel tipo de problemas que deben dejarse de lado. Cualquier 
respuesta dada ocupa un lugar en el tiempo, y se halla dentro de una matriz formada por otros 
tipos de conductas similares y diferentes. Las interacciones que se producen forman parte del 
mundo conductual real, y constituyen a la vez apasionantes problemas de laboratorio. 
Sin embargo, la variabilidad que se deriva de estas interacciones es una variabilidad determinada, 
no aleatoria, y constituye un tipo de variabilidad que debe ser comprendida antes de que 
podamos confeccionar un balance de la conducta que resultará útil, ya sea desde un punto de 
vista descriptivo o como base de para la integración de teórica y la aplicación práctica. Puede muy 
bien resultar que las técnicas experimentales diseñadas con el fin de eliminar la interacción 
recíproca entre la conducta y las contingencias que la controlan, sean herramientas inadecuadas 
para la labor con que nos enfrentamos. Una técnica común consiste, por ejemplo, en realizar 
“ensayos” bien delimitados, ampliamente separados entre sí. Así, el sujeto es sometido a las 
condiciones experimentales una sola vez, pongamos por caso, cada día, y sólo se permite que 


tenga lugar una respuesta en cada tratamiento. De este modo, se supone que los efectos de 
interacción del tipo que he descrito quedarán eliminados. 


Ciertamente, la separación temporal entre respuestas asegura que la tasa de respuesta no se 
convertirá en un factor de control importante, pero no está tan claro que se impida que otras 
características de la conducta se influyan recíprocamente entre sí, así como con las contingencias 
que la mantienen. Cuando se refuerza una respuesta con ciertas propiedades incidentes bajo 
determinadas condiciones, es probable que dicha respuesta particular, juntamente con muchas de 
sus características incidentes, se produzca la próxima vez que se halle en condiciones similares a 
aquéllas. Esto resultará cierto tanto s la próxima respuesta es ocasionada al cabo de dos segundos, 
como al cabo de dos años, debido a que la acción del reforzamiento es automática y duradera, de 
lo que se deduce que un espaciamiento artificial de los “ensayos” experimentales no elimina los 
efectos acumulados. Así, en un experimento que requiera que un sujeto humano apriete uno de 
los pulsadores, tendrá un efecto acumulativo que no se disipará en 24 horas o más. Mientras que 
no es probable que una tasa de respuesta resulte accidentalmente condicionada, secuencias 
distintas de respuestas sobre ambos pulsadores sí pueden resultar reforzadas por casualidad con 
suficiente frecuencia como para producir una variabilidad considerable en los datos. 


A menos que una secuencia dada adquiera primacía debido a que ha sido reforzada con suficiente 
frecuencia como para iniciar un proceso de desbocamiento, en espiral, no es probable que esta 
fuente de variabilidad sea puesta de manifiesto por un análisis estadístico de los datos, dado que 
las propias secuencias accidentalmente reforzadas variarán con respecto a sus pautas particulares, 
y a la duración del período de tiempo en que persisten. Nuestro conocimiento de la existencia de 
tales efectos no proviene de un análisis de datos particulares, sino más bien de una familiaridad 
con los propios principios generales que han sido demostrados directamente en experimentos 
apropiados. 


Ello nos lleva a considerar el mayor defecto de las técnicas experimentales diseñadas para eliminar 
la variabilidad que resulta de variaciones circulares entre la conducta y el ambiente que la 
controla. No sólo son estas técnicas generalmente ineficaces para eliminar dicha variabilidad, sino 
que, a la vez, la ocultan, de hecho, a nuestra vista, impidiendo con ello un análisis adecuado. 
Además de la interacción entre las respuestas que dan lugar a los datos primarios del 
experimento, hay una cadena de acontecimientos que tiene lugar entre los ensayos 
experimentales, hay una cadena de acontecimientos que tiene lugar entre los ensayos 
experimentales, que es desconocida y, en general, pasa desapercibida. La conducta que se emite 
inmediatamente antes, durante un período previo de considerable duración y después de que el 
sujeto se halle en la situación experimental, no está desligada de la conducta que se registra. 
El experimento puede confinarse a un intervalo de tiempo limitado, pero el sujeto continúa 
comportándose durante los períodos entre sesione experimentales. Debido a ello, la falta de 
identificación de las interacciones que tienen lugar entre la conducta registrada y la que no lo es, 
no equivale a eliminar estas interacciones de los datos. 


LA VARIABILIDAD COMO PROBLEMA DE “CAPACIDAD” 


Al parecer no existen dos individuos con una dotación genética exactamente igual. Además de las 
diferencias hereditarias, o quizás debido a ellas, los individuos también varían con respecto a su 
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“geografía” y función anatómicas, su fisiología, la química de su cuerpo y muchos otros aspectos 
de su funcionamiento interno. Se supone que tales factores y otros similares afectan a la 
conducta, y hay una evidencia considerable, a un nivel de análisis grosero, de que realmente es 
así. la noción de variabilidad intrínseca obtiene de esta evidencia uno de sus más poderosos 


apoyos. 


Cuando se formula a partir de esta base, la variabilidad intrínseca es un concepto algo distinto del 
que he expuesto anteriormente. La variabilidad intrínseca tal como la consideramos ahora no 
implica indeterminismo, puesto que el psicólogo la considera intrínseca sólo porque su 
competencia no suele extenderse hasta aquellos dominios fisiológicos de donde se supone que 
proviene la variabilidad. El fisiólogo, por otra parte, que está convencido de que su objeto de 
estudio es intrínsecamente ordenado y sujeto a leyes, puede imputar la variabilidad que observa a 
la bioquímica del sujeto, y sólo considera a aquélla intrínseca, en la medida en que carece de la 
información y las técnicas necesarias para investigar los procesos bioquímicos relevantes. 
El bioquímico, a su vez, intenta salvar su ciencia, del estigma de la variabilidad, localizando su foco 
en el gen, y es el genetista quien lleva toda la carga sobre sus hombros, a pesar de que 
recientemente ha empezado a devolver parte del fardo al bioquímico. (Existe la fascinante 
posibilidad de que esta cadena de casualidad continúe su marcha atrás todavía más lejos, de modo 
que la responsabilidad, en último término, de explicar la variabilidad de la acción genética recaiga 
en el psicólogo.) 


Algunos genetistas, así como muchos miembros de estas disciplinas biológicas intermedias en la 
cadena que va de la psicología a la genética, aceptan este fardo con alegría, como si fuera un 
artículo de fe. De lo que muchos de ellos no se dan cuenta es de la debilidad que existe en la cima 
de la estructura, de la cual se supone que ellos forman la base. Dicho crudamente, se les embauca. 
Ello se debe a que los psicólogos, tal como he explicado en secciones anteriores, no son aún 
capaces de establecer inequívocamente si la variabilidad de sus datos proviene de un control 
experimental inadecuado, de una comprensión insuficiente de los procesos implicados, o bien de 
factores que se hallan fuera de su área de competencia. O, tal vez, esté siendo injusto con el 
genetista, dado que su parquedad de colaboración en investigaciones experimentales sobre la 
supuesta determinación genética de la conducta, quizás pueda explicarse por su reconocimiento 
intuitivo de las inconsistencias de que adolece la psicología. Hasta que el psicólogo pueda 
proporcionar líneas de base, libres de otras fuentes importantes de variabilidad, se sacará poco 
provecho de la unión de estas dos disciplinas en una empresa común. (Desde luego, puede existir 
la misma dificultad en sentido opuesto, pero no me puedo considerar juez competente en este 
asunto.) Se podrían hacer comentarios parecidos con respecto a otras áreas biológicas que se 
supone que han alcanzado un control sobre algunas variables conductuales clave. 


Como consecuencia, al menos en parte, de la especificación inadecuada de los procesos a nivel 
estrictamente conductual, la investigación en psicología fisiológica (que a partir de ahora usaré 
como término general para referirme a las relaciones entre la conducta y todos los demás tipos de 
variables ecológicas) se ha orientado a sí misma, en gran parte, bajo un concepto grosero, amorfo, 
con funciones de cajón de sastre, que podemos denominar “capacidad”. Siguiendo este enfoque, 
los sujetos experimentales (y más frecuentemente, grupos de sujetos) se comparan con respecto a 
su aptitud para ejecutar tareas determinadas. Así, puede hallarse que una determina da cepa de 
ratas es superior a otra para aprender a recorrer un laberinto sin error. Con frecuencia, la 
diferencia entre las dos cepas se imputa a variaciones en la “aptitud de aprender”. En otro 
experimento típico, se observa que los animales a los que se les ha seccionado una porción de 
cerebro pierden, al menos temporalmente, determinada muestra de conducta aprendida, como, 
por ejemplo, una respuesta de evitación. Luego se mantiene que aquella porción extirpada tiene 
algo que ver con la “memoria” o “capacidad de retención”, o que incluso es la sede de estas 
“capacidades”. O bien, se toma un animal al que se administra una estimulación eléctrica 
intracraneal, simultáneamente a la presentación de un estímulo que controla una reacción de 
elección. Si dicho animal deja de hacer la elección correcta, de un modo consistente, se considera 
que la estimulación intracraneal ha destruido la “capacidad de discriminar” del animal. 


Basándose en estos y otros descubrimientos parecidos, se ha supuesto que las variaciones 
fisiológicas incontroladas dentro del organismo pueden ser las causantes de gran parte de la 
variabilidad conductual observada. El tipo de razonamiento aquí implicado es totalmente correcto, 
puesto que cuando se descubre que una variable puede afectar la conducta, es razonable suponer 
que en realidad lo hace, bajo las condiciones adecuadas. Sin embargo, ¿qué hemos descubierto 
acerca de la pretendida relación existente entre las variaciones fisiológicas y la conducta? La cepa 
A de ratas quizás aprenda a recorrer un laberinto particular antes de que lo haga la cepa B, pero 
tal vez ésta aprenda a ejecutar una respuesta de evitación, o incluso a recorrer otro tipo de 
laberinto, en menos tiempo que aquél. Si éste es el caso, ¿qué podemos decir acerca de la relación 
entre la dotación genética y la capacidad de aprender? Resulta evidente que no hemos analizado 
con la corrección suficiente los procesos conductuales implicados en las distintas situaciones de 
aprendizaje para poder comprender dónde reside la verdadera relación entre el gen y la conducta. 
Los experimentos que exploran otros tipos de factores fisiológicos resultan igualmente 
vulnerables, puesto que no es la “capacidad” del organismo para hacer nada que se ve afectada, 
sino algún proceso conductual que puede o no poseer una generalidad de tipo tan amplio como la 
que comportan términos tales como aprendizaje, memoria, etc. 


El objeto de esta discusión no ha sido el de negar la importancia de los factores fisiológicos como 
agentes determinantes tanto de la variabilidad como la regularidad en la conducta. Más bien he 
pretendido poner de relieve la excesiva generalización que se confiere a gran parte de los hechos 
en que se basa una tal concepción. También es posible sugerir algunas de las direcciones en que se 
podría orientar la investigación para llegar a una explicación más firme de la variabilidad 
conductual derivada de factores fisiológicos. Al igual que otros focos de variabilidad, también éste 
debe desvelarse y explorarse antes de que podamos atacarlo. 


Un paso a efectuar consistiría, lógicamente, en refinar las técnicas fisiológicas. Este proceso de 
refinamiento ya está en marcha en fisiología, anatomía y áreas relacionadas con ellas. No hay 
ninguna necesidad, y quizás no siquiera sea deseable, que los perfeccionamientos técnicos en 
estas áreas mencionadas se vean influidos, en modo alguno, por problemas de investigación 
conductual. La mayoría de técnicas fisiológicas que han demostrado ser de utilidad al 
psicofisiólogo —técnicas quirúrgicas, métodos para lesionar fibras nerviosas, estimulación eléctrica 
de músculos y nervios así como el registro de su actividad, experimentación con hormonas y 
fármacos, etcétera—- se han desarrollado a partir de intereses inmediatos totalmente 
independientes de la conducta. Aquellos psicólogos interesados en las contribuciones de la 
fisiología a la conducta rara vez pueden ser inculpados de ignorancia de las técnicas fisiológicas; en 
general, su error ha consistido en emplear dichas técnicas demasiado pronto, antes de haber 
comprendido suficientemente los actos que con ellas se obtienen. 


En la vertiente opuesta se halla el problema de desarrollar técnicas para la investigación 
conductual, así como de sistematizar los datos que resulten de ellas. Debería parecer una 
necesidad obvia la existencia de sólidos puntos de referencia técnicos y sistemáticos tanto por el 
lado de la conducta como por el de la fisiología antes de poder aspirar a cualquier colaboración 
fructífera entre las dos. Resulta curioso el hecho de que se haya convertido en un tema de la 
psicología cargado de connotaciones emotivas y que, aún hoy, se debate con apasionamiento. 


B. F Skinner juega a la vez el papel de héroe y villano e gran parte de los más recientes debates. 
En 1938, Skinner sugirió, con toda la buena intención, que una investigación conductual intensiva 
era, por derecho propio, un prerrequisito necesario para una comprensión adecuada de los 
procesos neurológicos correlativos a la conducta (81, páginas 418-432). Juntamente con esta 
sugerencia, presentó una poderosa justificación empírica de la necesidad de una ciencia 
independiente de la conducta. 


Un amplio sector de la psicología se subdividió individualmente en dos campos, cada uno de los 
cuales reaccionaba a la sugerencia de Skinner según sus propias esperanzas y temores. Muchos de 
aquellos no tenían interés alguno por la búsqueda de puntos de contacto entre la psicología y la 
fisiología consideraron que Skinner había demostrado al futilidad de tal propósito. Otros, creyeron 
que Skinner intentaba hundir la psicología fisiológica, que por aquel entonces pugnaba por salir a 
flote. Se le tipificó como como defensor del “organismo vacío”, una caracterización que el 
estudiante probablemente encuentre todavía en algunos apuntes con que debe preparar sus 
exámenes. 


Los progresos realizados posteriormente han servido para demostrar que cada facción había 
exagerado el caso. Con frecuencia oigo comentarios que denotan gran sorpresa en investigadores 
pertenecientes a ambos enfoques, cuando se dan cuenta de que parte de la investigación actual 
más significativa dentro de la psicología fisiológica se lleva a cabo mediante técnicas conductuales 
que fueron desarrolladas por Skinner y sus colaboradores. Este proceso no se ha debido a 
transigencia, por parte de ninguno de los dos grupos de extremistas, en sus insostenibles posturas, 
sino que, por el contrario, ha sido el fruto natural de una valoración creciente, tanto por parte de 


psicólogos como de fisiólogos, de sus técnicas recíprocas. La contribución de las técnicas de 
condicionamiento operante a una mejor comprensión de las variables fisiológicas ha resultado 
posible, hasta el momento, gracias a la consistencia y posibilidad de reproducción de las líneas de 
base conductuales empleadas, habiéndose eliminado suficientemente otras fuentes de 
variabilidad de algunas de estas líneas de base hasta el punto de permitir su uso en la 
identificación de focos de variabilidad fisiológicos y neurológicos. 


Sin embargo, nos hayamos al borde de presenciar avances más significativos, posibilitados por el 
tipo de análisis funcional de la conducta llevado a cabo en los laboratorios de condicionamiento 
operante. Actualmente resulta factible generar líneas de base que no sólo sean estables en un 
organismo individual, sino que, además, se hallen bajo el control de variables de gran generalidad. 
Por ejemplo, se ha observado que muchas características distintivas de la conducta bajo varios 
programas de reforzamiento dependen de pautas particulares de reforzamiento de los intervalos 
entre respuestas. La extendida acción de esta variable está siendo rápidamente confirmada y 
llevada a la práctica en el laboratorio, aunque más acorde con la presente discusión en el hecho de 
que también resulte posible generar líneas de base conductuales controladas casi completamente 
por el reforzamiento deliberado de intervalos entre respuestas especificadas. Cuando en el 
estudio de factores fisiológicos se emplea una conducta de gran generalidad controlada con 
precisión, los datos obtenidos pueden aplicarse a diversas situaciones, de modo que podemos 
esperar un uso creciente de líneas de base conductuales que, como revela el análisis funcional, se 
hallan bajo el control de variables relevantes en una gran variedad de contextos. 


No se puede realizar el descubrimiento de tales variables clasificando la conducta en términos de 
“aptitudes” o “capacidades” del organismo, así como tampoco es suficiente conceptualizarla como 
una actividad de “resolución de problemas”. Estos términos sólo consiguen almacenar distintas 
clases de conducta en grupos clasificatorios, que se disuelven tan pronto se demuestra que están 
formados por distintos procesos conductuales. Un análisis funcional detallado de las relaciones 
entre la conducta y las variables específicas que la controlan puede, por otra parte, dar lugar a una 
útil clasificación, dado que un enfoque descriptivo producirá un cuerpo de observaciones 
mutuamente relacionadas que incrementará grandemente la generalidad conductual de cualquier 
variable fisiológica. 


Puede llevarse a cabo un análisis similar de los problemas planteados en la vertiente fisiológica, 
puesto que una investigación intensiva de las variables que pertenecen a esta vertiente, por medio 
de técnicas también fisiológicas, debe proceder a cualquier aplicación al estudio de la conducta. 
Así, un método que produzca consecuencias fisiológicas desconocidas o insuficientemente 
comprendidas tiene poco valor como herramienta para investigar las contribuciones fisiológicas a 
la variabilidad conductual. 


La investigación de factores fisiológicos relacionados con los procesos conductuales requiere un 
alto grado de integración descriptiva y de competencia individual en varias áreas. El creciente 
reconocimiento de este hecho ha conducido, en los últimos años, a un enfoque algo nuevo del 
problema de la investigación interdisciplinaria en el campo de las ciencias de la conducta. Llegó a 


resultar habitual, cuando se había de formar un grupo de investigadores expertos en varias ramas 
científicas, buscara un psicofisiólogo, a un biopsicólogo o bien a un psicofarmacólogo, es decir, 
investigadores que pretenden ser competentes a la vez en psicología y en alguna otra disciplina 
biológica. Sin embargo, ocurría con demasiada frecuencia que el psicofisiólogo resultaba ser un 
fisiólogo competente y un psicólogo aficionado, o viceversa, y que el psicofarmacólogo resultaba 
conocer a fondo las técnicas farmacológicas y sólo se titulaba psicólogo en virtud de su interés por 
los fármacos que actúan sobre el sistema nervioso central. 


La nueva concepción de investigación interdisciplinaria requiere un grupo de investigadores, cada 
uno de los cuales sea competente en un campo restringido, ya sea psicología, electrofisiología, 
farmacología, anatomía, endocrinología o cualquier otro dentro de una vasta gama de 
posibilidades. A medida que cada uno de ellos resuelva sus propios problemas, por su interés 
intrínseco e independientemente de consideraciones interdisciplinarias, desarrollará sus técnicas y 
la comprensión de su área de estudio particular, hasta el punto de que se puedan aplicar, con un 
grado de fiabilidad elevado, a problemas que exigen una investigación cooperativa. Mediante un 
planteamiento de este tipo es suficiente que cada investigador tenga un interés inteligente por las 
demás áreas, de modo que sepa apreciar potenciales puntos de contacto, y no es necesario que el 
grupo sea, en ningún sentido, un “equipo” organizado., dado que el investigador competente e 
interesado se sentirá orgulloso deber sus técnicas extendidas a otras áreas en que no preveía u 
importancia. Las competencias que requiere la colaboración aparecen a medida que cada campo 
de estudio prosigue su desarrollo independiente. El desarrollo y la sistematización de cada una de 
las disciplinas científicas implicadas en la investigación global constituyen el medio para un 
eventual ataque a los focos de variabilidad conductual atribuibles a factores fisiológicos. 


VARIABILIDAD Y SELECCIÓN DE DATOS 


Se suele enseñar a los estudiantes que si se presenta, en un informe, cualquier dato procedente 
de un experimento particular, deben presentarse necesariamente todos los datos. Se supone que 
la elección de datos constituye un crimen terrible, indigno del desapego que se atribuye la ciencia 
en aras de la objetividad. Sin embargo, muchos estudiantes pronto se dan cuenta de que no todos 
sus profesores son consecuentes en la aplicación de esta norma, particularmente en lo que toca a 
su propio trabajo, y se aperciben de que la norma es, en realidad, que los estudiantes nunca deben 
seleccionar los datos. 


Tal vez decir esto parezca una injusticia, pero es sensato, por razones que esclareceré dentro de 
poco. Algunos estudiantes adoptan la prudente postura de aceptar un doble sentido en la norma, 
y, a medida que maduran, asumen gradualmente una actitud racional y responsable hacia la 
selección de datos en sus propios experimentos. Sin embargo, y por desgracia, algunos estudiantes 
nunca maduran en este sentido. Sus experimentos pueden estar empapados de la variabilidad que 
resulta de un control experimental insuficiente, aunque, puros en su objetividad, lo comunican 
todo. Continuamente inundan la literatura científica con informes plagados de “aunques, sin 
embargos y peros”, característicos de los datos incluyentes. 


Antes de pasar a describir y justificar la necesaria práctica de la selección de datos, vale la pena 
decir que el problema es de lo más delicado. Las situaciones más difíciles surgen cuando los 
experimentos se realizan con vistas a la comprobación de una teoría. Se reconoce, al menos de un 
modo implícito, que, a pesar de sus protestas públicas en sentido contrario, los científicos suelen 
estar intensa y personalmente comprometidos con sus propias teorías. Consiguientemente, la 
selección de datos realizada en los experimentos orientados a la comprobación de una teoría 
aconseja un prudente escepticismo, de modo que uno debe preguntarse si dicha selección se 
efectuó sobre la base de una práctica legitima o bien si, por el contrario, ya sea deliberadamente o 
de cualquier otro modo, se parió del criterio de compatibilidad con una hipótesis determinada. 


Puedo destacar el hecho de que en una ciencia altamente sistematizada incluso el segundo 
procedimiento es a menudo justificado. En algunas áreas, la sistematización se ha convertido en 
regla, y los conceptos unificadores se hallan, de un modo característico, rigurosamente 
especificados, sin que ello ocasione, al parecer, lagunas en el razonamiento. En este tipo de áreas, 
los datos que se muestran en contradicción con un marco sistemático, por lo general efectivo, 
pueden rechazarse por ser considerados como focos de variabilidad incontrolados. Por otra parte, 
es probable que en una ciencia que ha alcanzado un alto grado de desarrollo esta variabilidad sea 
relativamente rara, excepto, quizás, en sus áreas de investigación más avanzadas. Sin embargo, 
también puede oírse defender el enfoque contrario, es decir, que una variabilidad desusada en el 
marco de una disciplina científica altamente controlada y con un elevado grado de integración, 
tiene una importancia excepcional, con lo que se requerirá una revisión substancial de la 
sistematización. La psicología tiene pocas teorías, si es que tiene alguna, tan rigurosamente 
formuladas y tan bien documentadas como para que este problema pueda preocuparle. 
Sin embargo, hay, al menos en curso de desarrollo, un cierto número de generalizaciones 
empíricas locales que exigirán una solución al problema de si se deben rechazar los datos 
contradictorios, o si, por el contrario, procede aceptarlos como sistemáticamente importantes. 


¿Cómo se deberá resolver este problema? La respuesta honrada parece ser la más simple: 
Citar todos los datos. Sin embargo, esta respuesta no es tan honrada como parece, y es, además, 
totalmente irresponsable, puesto que si un experimentador tiene razones para creer que un caso 
de variabilidad substancial proviene de focos incontrolados, no tiene ninguna obligación de 
imponer tales datos a la literatura científica y sus colegas. Si la variabilidad incontrolada sólo 
raramente tiene lugar, un experimentador puede, justificadamente, no mencionar siquiera 
aquellos datos, puesto que ninguno de sus colegas está tan bien informado acerca de las posibles 
fuentes de variabilidad incontrolada en un laboratorio dado, como el mismo experimentad or que 
trabaja en él. Es él quien se halla en mejores condiciones para evaluar estos casos, y no debe 
traspasar su responsabilidad a otros. Si la variabilidad se muestra con la suficiente frecuencia 
como para constituir u grave problema, nuestro investigador deberá informar acerca de ninguno 
de sus datos hasta haber eliminado las fuentes de los datos que discrepan. No existen posiciones 
intermedias. 


Una decisión sobre si una variabilidad observada constituye un problema grave no tiene por qué 
ser arbitraria, como tampoco es necesario o ni siquiera deseable apelar a criterios de más peso 


será la regularidad de los datos discrepantes, de modo que si las excepciones al cuerpo de datos 
principal muestran evidencia de que están sujetos a ley, requerirán una explicación, no pudiendo 
ser desechadas como casos aislados de variables caprichosas. No importa la rareza de la 
excepción; si muestra una regularidad propia, deberá investigarse a fondo. Si un sujeto 
discrepante muestra, por ejemplo, una curva que presenta una relación inversa en lugar de la 
directa usualmente observada con respecto a la variable independiente, dicho sujeto debe 
respetarse, y no será procedente ni ignorar deliberadamente sus datos ni promediarlos con los de 
otros sujetos. Por el contrario, si un sujeto ocasionalmente discrepante no muestra ningún orden 
aparente en su conducta, se le puede pasar por alto. Como máximo, el experimentador informará 
de la existencia de tal sujeto, pero no tiene por qué abrumar a sus colegas con sus datos. 


Una situación parecida tiene lugar en el caso de existir una variabilidad intrasujeto. Si la conducta 
de un sujeto dado muestra fluctuaciones cíclicas u otro tipo de regularidad, el experimentador no 
podrá pasar por alto esta variabilidad, dado que probablemente se mostrará presente y jugará un 
papel decisivo en los intentos de replicación llevados a cabo posteriormente por él mismo u otros 
investigadores. Por el contrario, si las fluctuaciones en cuestión no parecen sistemáticas y resultan 
pequeñas en comparación con los fenómenos de primordial interés, pueden considerarse como 
“perturbación” de fondo sin más consecuencias. 


También es legítimo hacer caso omiso de una desviación aun cuando sea importante si sólo 
aparece raramente. Tales desviaciones no son, en modo alguno, indeterminadas, aunque su baja 
frecuencia de aparición así como su falta de relación aparente con las variables críticas del 
experimento indica que están controladas por factores extraños a la investigación. 
Las desviaciones mencionadas pueden pasarse por alto debido a que no es probable que 
aparezcan en replicaciones, y debido también a que su inclusión en su informe probablemente 
dará lugar a debates episódicos que sólo servirán para oscurecer los puntos primordiales. 


A veces, pueden producirse fluctuaciones ocasionales de importancia que tengan lugar con la 
suficiente frecuencia para correlacionarlas con algún factor específico, al margen del interés 
general de la investigación que se está llevando a cabo. Por ejemplo, tal vez se estropee un 
aparato de aire acondicionado a medio experimento, con lo cual, si el investigador observa 
cambios significativos en las líneas de base, que aparte de ello se muestran consistentemente 
estables, coincidiendo con tales averías, hay razón suficiente para descartar los datos 
discrepantes, dando por sentado que la variabilidad fue producida por un factor extraño al 
propósito de la investigación. Si los datos discrepantes se incluyeran en una línea de base por lo 
demás estable, es posible que los cambios subsiguientes, inducidos por una variable 
deliberadamente manipulada, fueran rechazados erróneamente por no sobrepasar la variabilidad 
de la línea de base. 


En distintas ocasiones he hecho una distinción entre la variabilidad frecuente y la accidental. 
Sin embargo, podemos preguntarnos cómo determinar si un caso excepcional es sólo esporádico, 
o qué frecuencia resulta aceptable en los datos discrepantes. No hay una respuesta fija a estas 
preguntas, puesto que cada caso requiere su propia valoración, con lo cual se hace necesario 


depender de la experiencia e integridad del investigador. Cuanto más haya trabajado en un área, y 
cuanto más extensa sea su familiaridad con el trabajo realizado por otros en el mismo campo, 
tanto mayor será su capacidad para evaluar un caso dado. 


Indudablemente se cometerán errores, pero hay que observar, sin embargo, ciertos principios 
generales de prudencia. Así, al comienzo de un programa experimental no puede pasarse por alto 
ningún caso de variabilidad, dado que es imposible hacer una estimación realista de la 
probabilidad de que la discrepancia en cuestión vuelva a producirse. Dicha estimación sólo puede 
hacerse a partir de una muestra de datos ya hallados, y cuanto mayor sea esta muestra, tanto más 
exacta será la predicción. Ésta es la razón por la que se puede aceptar un doble sentido en la 
norma de no seleccionar datos, según la cual esta práctica no está permitida a los investigadores 
inexpertos, mientras que sus colegas más avezados pueden hacerlo. La solución ideal sería la de 
aconsejar la publicación de series de investigaciones integradas y relativamente largas, dado que 
en el momento en que un experimentador termine un programa experimental de este tipo, habrá 
tenido suficiente experiencia con su objeto de estudio para poderse permitir enjuiciar la 
conveniencia de aceptar o rechazar los datos variables. Desgraciadamente, la presión que 
actualmente se ejerce para que se publique con frecuencia, junto con sus compensaciones 
económicas, mitiga grandemente la posibilidad de que se actué de este modo. 


Una de las consecuencias que se derivan de ello es la excesiva cantidad de datos triviales y 
extensos argumentos explicativos que caracterizan muchas disertaciones magistrales en 
psicología. El joven investigador, debido a la presión ejercida por sus compañeros y a su propia 
inseguridad con respecto al área en que trabaja, debe presentar todos sus datos, incluyendo 
igualmente todos los casos de variabilidad. En razón de publicar dichos casos, se ve forzado a 
discutirlos, con lo cual se forma una intrincada red construida a base de teoría, especulación y 
experimentos de confirmación, a fin de justificar unos pequeños efectos cuya importancia no está 
calificado para juzgar. 


Un aspecto crítico del problema lo constituye el estadio de la investigación en que aparece la 
variabilidad. Un sujeto puede haber producido cientos de horas de línea de base estable, pero en 
las horas inmediatamente anteriores a la introducción de una nueva variable, tal vez se produzca 
un cambio en su conducta. Incluso si siendo el experimentador un gato viejo no ha observado 
nunca un cambio parecido en el pasado, y es incapaz de correlacionarlo con ninguna variación en 
los factores con que controla la conducta, no puede pasar por alto la anomalía en esta etapa de la 
investigación. Por el contrario, debe cambiar de planes y retrasar la introducción de la nueva 
variable, hasta que disponga de datos adicionales, dado que la súbita e inexplicable variabilidad 
puede representar un cambio permanente en la conducta de línea de base, producido, quizá, por 
un proceso inesperado que ha ido tomando cuerpo poco a poco. Por lo tanto, deberá proseguir 
con la línea de base, a fin de determinar si la repentina variabilidad puede dejarse de lado o si, por 
el contrario, debe tomarse en consideración en el momento de evaluar los resultados 
subsiguientes. 


También puede resultar que la conducta, cambiada por un factor desconocido de acción fugaz, 
necesite un tiempo considerable para recobrar su estado de línea de base. La discusión de este 
problema resultará más apropiada en las secciones dedicadas en la reversibilidad y a los datos 
estables (capítulo 8), pero constituye una de las posibilidades que más precaución exigen al 
aceptar los daos discrepantes. El hecho de que la variabilidad persista durante un período de 
tiempo relativamente largo no es un criterio absoluto para aceptarla como relevante a la conducta 
que se investiga. 


Al evaluar datos, a veces resulta útil no sólo rechazar los datos contradictorios de un sujeto dado, 
sino también eliminar sujetos. Sin embargo, el segundo procedimiento está sólo justificado si el 
investigador puede identificar los factores responsables de la conducta de los sujetos 
discrepantes, puesto que, de lo contrario se expone a la acusación de haber seleccionado los datos 
guiándose por sus ideas preconcebidas sobre los resultados experimentales. 


Supongamos, por ejemplo, que tres sujetos muestren una relación lineal inversa entre la 
probabilidad de respuesta y una variable independiente, mientras que un cuarto sujeto no resulte 
afectado por dicha variable. Por norma general, el experimentador debería considerar los datos de 
los cuatro sujetos al evaluar la fiabilidad de sus manipulaciones experimentales, pero quizá 
descubra, al hallar una información adicional, que la diferencia entre los dos tipos de curva puede 
explicarse por las diferencias particulares entre las historias conductuales de los sujetos. En este 
caso puede afirmar que la relación lineal inversa es característica de los sujetos con una historia 
conductual determinada, de modo que el sujeto excepcional habrá servido para esclarecer, más 
que para oscurecer, el proceso conductual que se investiga. 


Al reducir de esta manera la población a la que se puede aplicar un resultado experimental dado, 
no se pierde generalidad en los datos. En realidad, la generalidad aumenta, y es muy poco realista 
esperar que una variable dada tenga los mismos efectos sobre todos los sujetos posibles y bajo 
toda suerte de condiciones. A medida que identificamos y controlamos un mayor número de los 
factores que determinan los efectos de una operación experimental dada, de hecho reducimos la 
variabilidad que pueda esperarse como consecuencia de la alteración, posibilitándose así la 
obtención de los mismos resultados en un número mayor de sujetos. Dicha generalidad nunca 
podría lograrse si aceptáramos, simplemente, la variabilidad entre sujetos, y asignásemos al 
mismo valor a todos los sujetos discrepantes en una investigación determinada. 


VI. La variabilidad como problema científico y de ingeniería 


En el capítulo precedente he tratado algunos de los principales focos de variabilidad y métodos 
para combatirla en experimentos conductuales. La tesis en que se ha apoyado dicha discusión era 
que la variabilidad no es intrínseca al objeto de estudio, sino que proviene, por el contrario, de 
causas posibles de descubrir y controlar. A pesar de todo se dejaba una puerta abierta a la 
admisión de la variabilidad intrínseca, pero sólo después, si éste era el caso, de que un alto grado 
de desarrollo técnico y de sistematización de datos nos hubiera forzado a aceptarla. 


Cualquier muestra de conducta se halla bajo el control de una multiplicidad de variables, algunas 
de las cuales se supone que se mantienen constantes en un experimento dado, mientras que otras 
simplemente se desconocen. En ocasiones puede localizarse la variabilidad de un conjunto de 
datos entre factores de este tipo. Así, puede encontrarse que dos sujetos difieran en su respuesta 
a la variable A, aunque ello no se deba a la existencia de variabilidad intrínseca en la relación entre 
la variable A y la conducta, sino que sea debido a que hay, entre ambos sujetos, una diferencia en 
su respuesta a la variable B, que se influye recíprocamente con la variable A. Una solución de este 
tipo explica la variabilidad en un experimento dado de un modo determinista, sin dar por sentado 
que la variabilidad observada es inherente a la conducta. 


El proceso de perseguir e identificar sistemáticamente las causas de variabilidad, explicando así los 
datos discrepantes, es característico de la práctica científica. Sin embargo, la variabilidad puede 
tener distintas implicaciones para los investigadores que podríamos denominar ingenieros 
conductuales (sin que ello implique ningún juicio de valor o ni tan sólo una estricta dicotomía 
entre los términos “científico” e “ingeniero”). Dentro de la categoría de ingenieros conductuales 
incluyo a aquéllos que trabajan en tests de aptitudes a inteligencia, interacciones entre hombre y 
máquina, terapéutica y diagnóstico conductual, sondeo y control de opinión, y demás aspectos 
relacionados de la psicología aplicada. Tales profesionales no pueden, por regla general, tratar de 
variabilidad del modo que he descrito, y no deberían confundirse los dos tipos de problemas. 
El ingeniero conductual debe, de ordinario, tomar la variabilidad tal como la encuentra, y tratarla 
como un hecho inevitable de la vida. Por ejemplo, la investigación básica puede aconsejar, y de 
hecho así ha sido, que un método para aumentar la probabilidad de que un observador de radar 
detecte señales desusadas consiste en proyectar señales artificiales en su pantalla.** Sin embargo, 
surgirán muchos problemas al llevar a la práctica esta sugerencia, como por ejemplo saber con 
qué frecuencia deberían proyectarse dichas señales. La frecuencia óptima de presentación 
indudablemente variará con cada observador, y no consuela al ingeniero saber que pueden 
identificarse las causas de esta variabilidad. A menos que ésta se pueda eliminar, mediante un 
entrenamiento especial por ejemplo, deberá llegar a algún tipo de pacto con ella, y adoptar una 
solución intermedia, de modo que acabará presentando las señales artificiales con una frecuencia 
que supone, o ha determinado experimentalmente, que resultará óptima para la mayoría de 
observadores bajo las más variadas condiciones. 


Cronbach ha hecho una distinción entre psicología pura y aplicada, que, a pesar de que es más 
amplia que la que yo he propuesto, tiene, sin embargo, mucho en común con ella. 23 Este autor 


presenta “dos corrientes históricas de método, pensamiento y afiliación que transcurren a lo largo 
del último siglo de nuestra ciencia”. Denominando a una de estas corrientes psicología 
experimental y a la otra psicología de correlaciones, Cronbach las caracteriza del modo siguiente: 


La conocida virtud del método experimental es que coloca las variables ambientales bajo un control estricto. 
De este modo resultan posibles pruebas rigurosas de hipótesis y proposiciones fiables de causalidad. 
El método de correlaciones, por su parte, puede estudiar lo que el hombre no ha aprendido a controlar o lo 
que ni tan sólo puede aspirar a controlar. La Naturaleza ha estado experimentando desde el principio de los 
tiempos, con una audacia y complejidad muy lejanas de los recursos de que dispone la ciencia. La misión del 
“correlacionador” es la de observar y organizar los datos que obtiene la Naturaleza en sus experimentos. 
Como resultado, estas correlaciones mejoran, como mínimo, las decisiones inmediatas a tomar y guían la 
experimentación. Como máximo, un Newton, un Lyell o un Darwin pueden alinear las correlaciones 
observadas para formar una teoría sólida (22, página 672). 


El ingeniero conductual rara vez dispone de los medios o del tiempo que se requerirían para 
eliminar la variabilidad con que topa en un problema dado. Podemos simpatizar con su empeño y 
admirar sus logros ante tales dificultades. Sin embargo, algunos científicos puros van más allá de 
esta admiración, y lo que en realidad hacen es imitar al ingeniero, puesto que atacan sus 
problemas de corte científico puro como si fueran problemas de ingeniería. De ahí su insistencia 
sobre grandes muestras y criterios estadísticos de generalidad, la importancia dada a la 
generalidad de sujetos más que a la de principios, así como su aceptación resignada de la 
variabilidad intrínseca. 


Sin embargo, el científico puro dispone para sí de un lujo que el ingeniero no puede permitirse, y 
que, de hecho, muchos de éstos no consideran ni siquiera deseable. Este lujo consiste en la 
posibilidad de refinar las condiciones experimentales hasta que sólo conserven la más abstracta 
relación con el mundo tal como lo conocemos. Constituye un lujo porque requiere una cantidad de 
tiempo que no suelen permitir las acuciantes exigencias de los problemas inmediatamente 
prácticos, y supone una inversión económica a largo plazo que generalmente no se podría tolerar 
si este gasto se tuviera que incluir en el costo, y a veces en el precio de mercado, de un producto 
de ingeniería. El científico puro tiene la obligación de aprovecharse de ese lujo, dado que ha 
resultado rentable tanto en su aportación a nuestra comprensión de los fenómenos naturales 
como en aplicaciones prácticas a problemas de la ingeniería. La eliminación de la variabilidad en 
los experimentos de laboratorio tal vez no parezca un procedimiento racional para averiguar algo 
perteneciente al mundo obviamente variable que nos rodea. Sin embargo, se ha comprobado 
empíricamente que este procedimiento ha logrado éxitos considerables. Por ejemplo, se ha 
observado que principios de gran generalidad, descubiertos dentro del laboratorio, suelen operar 
en el mundo exterior, y que el conocimiento adquirido en el laboratorio de las técnicas para 
manipular y estudiar los factores relevantes, es con frecuencia lo suficientemente poderoso para 
contrarrestar los efectos debidos a focos naturales de variabilidad. Debido a ello, la obligación del 
investigador puro es mucho mayor ya que es el único que se dedica a esta tarea. 


La investigación pura ha adquirido un gran prestigio, y está recibiendo ahora, por primera vez en la 
historia, apoyo público tangible. El científico puro, ya se dedique a la conducta o a cualquier otro 


campo, descuida su obligación cuando tata su objeto de estudio como si fuera un problema de 
ingeniería. Así, cuando orienta sus técnicas conductuales con una concepción fatalista de 
variabilidad intrínseca, pierde su derecho a los lujos de investigación otorgados a la ciencia pura. 
De hecho, se halla en una peculiar situación intermedia, dado que mientras que sus metas 
declaradas son las de la investigación pura, sus técnicas son apropiadas para la solución de 
problemas inmediatamente prácticos. Como consecuencia no lleva acabo, en general, ni una cosa 
ni otra. 


LA VARIABILIDAD COMO DATO 


La distinción metodológica entre el científico puro y el ingeniero hacer resaltar el contraste entre 
la variabilidad como problema en la formulación de las leyes conductuales, y como problema de 
técnica experimental. En la medida en que la variabilidad se considera un producto de 
comprensión inadecuada o de un control insuficiente de las variables relevantes, o ambas cosas a 
la vez, no va más allá de ser un problema puramente experimental, de modo que el científico puro 
dirigirá sus esfuerzos hacia la eliminación de la variabilidad, al menos en la medida en que dicho 
proceso eliminatorio no se interfiera con sus descubrimientos substanciales. Por el contrario, el 
ingeniero aceptará, por necesidad, la variabilidad, la evaluará y la tendrá en consideración en sus 
recomendaciones, consistentes en sugerencias para una acción concreta. Así, por ejemplo, 
indicará como disponer los relojes en el panel de instrumentos de un aeroplano, qué elementos se 
deberán incluir en un test de inteligencia, qué medidas terapéuticas es necesario tomar, etcétera. 
El investigador puro hace sus recomendaciones en forma de leyes conductuales, que pueden 
variar desde una descripción de una relación empírica entre dos variables, hasta una 
sistematización global de un gran número de relaciones de este tipo. 


A menudo, las leyes no se enuncian de forma que tomen en consideración la variabilidad que en 
realidad se observó en los experimentos, sino que, por el contrario, se da por sentado que dicha 
variabilidad se ha reducido a un valor insignificante con respecto los fenómenos comprendidos en 
las leyes enunciadas, y que, si fuera necesario, podría reducirse todavía más por medio de una 
técnica experimental más rigurosa. De este modo se suele enunciar una ley como si existiera en 
forma pura, no contaminada por la variabilidad que siempre se puede observar si se efectúan 
mediciones lo suficientemente refinadas. 


Sin embargo, cuando la variabilidad observada sigue una regularidad, el científico está obligado a 
tenerla en cuenta al formular sus leyes. De hecho, la variabilidad puede resultar tan evidente que 
constituya el dato experimental de más interés — en el caso, por ejemplo, de que la variabilidad 
consistiera en determinadas oscilaciones regulares de la conducta. Estas oscilaciones, así como los 
efectos de las variables relevantes sobre las características de dichas oscilaciones, pueden 
proporcionar los datos sobre los cuales se base el enunciado de una ley conductual. 


Podemos, por ejemplo, diseñar un programa de reforzamiento de razón de modo que resulte 
“autorregulado”. Bajo un programa de razón fija, los sujetos muestran una tasa de respuestas de 


doble valor. Inmediatamente después de cada reforzamiento hay una pausa, durante la cual la 
tasa es igual a cero. Sin embargo, una vez que el animal ha comenzado a responder, continúa 
haciéndolo a una tasa alta, con un valor cercano al máximo posible, hasta que tiene lugar el 
próximo reforzamiento. Así, cuanto mayor sea esta proporción, o sea, cuanto mayor sea el 
número de respuestas requeridas por reforzamiento, más largas serán las pausas. Utilizando esta 
información. Podemos diseñar específicamente un programa de razón, de modo que dé lugar a un 
estado conductual oscilante. Simplemente, dejaremos que la magnitud de la razón se vaya 
ajustando según sea la duración de la pausa que sigue al reforzamiento (34, páginas 720 y 
siguientes). 
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FIGURA 19. Registros correspondientes a dos sujetos, mostrando las típicas pausas que siguen 
inmediatamente a cada reforzamiento (indicado por los cortos desplazamientos oblicuos de la 
plumilla) en un programa de razón fija, así como la rápida transición a una alta tasa terminal. 
(De Ferster y Skinner, 34, p. 52.) 


El número de respuestas requeridas para obtener un reforzamiento particular puede hacerse 
inversamente proporcional a la duración de la pausa precedente. Así, una pausa larga hará que el 
mecanismo de programación reduzca el número de respuestas requeridas para el próximo 


reforzamiento. Estas reducciones en la razón acortarán automáticamente las pausas 
subsiguientes, mientras que, a su vez, las pausas cortas harán que el mecanismo programador 
aumente el número de respuestas requeridas por cada reforzamiento, de modo que, en virtud de 
estos aumentos, las pausas resultarán de nuevo más largas. La conducta, medida por la duración 
de las pausas de postreforzamiento, oscilará alrededor de cualquiera que sea el valor óptimo bajo 
las condiciones particulares del experimento. El período y amplitud de las oscilaciones será una 
función de variables tales como la constante de proporcionalidad entre la duración de la pausa y la 
magnitud de la razón, los límites, superior e inferior, que se impongan a ésta, la cantidad de 
reforzamiento, drogas que utilicemos y muchos otros factores. 


La conducta resultante es, en principio, intrínsecamente variable, y puede describirse totalmente 
en función de las características de sus oscilaciones. La variabilidad, en este caso, se convierte en 
el dato sobre el cual se deberán basar las leyes conductuales, y no constituye simplemente un 
problema que requiera un refinamiento de las técnicas experimentales, puesto que la relación de 
tal variabilidad con dichas técnicas es de tipo indirecto. Así, si debido a una manipulación 
experimental deliberada podemos generar y controlar un estado conductual oscilante, 
conseguimos acceso a una información que nos permite comprender casos de variabilidad 
similares cuando se produzcan en situaciones incontroladas. La oscilación conductual en el 
programa de razón autorregulado nos ayuda nos ayuda a comprender por qué es difícil mantener 
una conducta de razón distendida —es decir, una conducta de razón caracterizada por las largas 
pausas que siguen a los reforzamientos— durante un período de tiempo relativamente largo. 
El procedimiento ordinario de razón no tiene ningún mecanismo de autorregulación incorporado, 
y dado que la razón permanece siempre a misma, independientemente de la duración de la pausa, 
es probable que las pausas largas generen otras aún más largas, de modo que, eventualmente, la 
conducta llegue a desaparecer. De un modo desaparecido, las pausas cortas inician un proceso 
que se acelera en sentido contrario, hasta que la conducta final se caracteriza por pausas de 
postreforzamiento extremadamente breves. 


Una información sistemática de este tipo tendrá como mínimo dos implicaciones para una 
tecnología de razón fija. Al generar la conducta de línea de base por medio del programa de 
reforzamiento de razón fija tenemos, en primer lugar, una base racional para decidir hasta qué 
punto dilatar la magnitud de la razón. En segundo lugar, disponemos de una técnica de medición, 
puesto que la longitud de la pausa de postreforzamiento ha demostrado ser un barómetro 
sensible de la conducta de razón. 


Un descubrimiento de que la variabilidad tiene su origen en la acción de un proceso cíclico de 
autorregulación, o bien en el hecho de que este proceso cíclico no llegue a autorregularse, tendrá 
una importante resonancia en el enunciado de las leyes conductuales, dado que no podemos dar 
por sentado que la variabilidad puede reducirse mediante un control experimental más riguroso. 
Por lo tanto, dichas leyes no podrán formularse de modo que pasen por alto la variabilidad que de 
hecho se observó en los experimentos relevantes, sino que, por el contrario, deben tenerla en 
cuenta, y lógicamente, tomarla como punto de partida. Tal variabilidad no es una mera 
perturbación de fondo sin importancia en el sistema, sino su dato central. Nos hallamos aquí ante 


un caso en el que las leyes basadas en la variabilidad tendrán prioridad sobre aquellas que dan por 
sentado que las variables básicas deben ser constantes. 


En el ejemplo de la razón autorregulada hemos discutido una técnica de investigar y explicar la 
conducta que oscila alrededor de un estado óptimo. Con un poco de inventiva, esta técnica puede 
aplicarse a una amplia gama de situaciones distintas. Sin embargo, parte de la variabilidad que se 
observa en los experimentos conductuales se debe a oscilaciones entre dos o más formas distintas 
de conducta, y no entre diversos estados de una misma respuesta. La investigación experimental 
directa hará posible una descripción sistemática de los factores causantes de dicha “variabilidad 
de respuesta”. 


En un tipo de experimento, por ejemplo, hay dos discos a disposición d una paloma sobre los 
cuales ésta puede picar. Las respuestas sobre uno de ellos obtienen reforzamiento bajo un 
programa de razón. Sin embargo, después de cada reforzamiento, aumenta el número de 
respuestas requeridas, es decir, la magnitud de la razón, aunque las respuestas sobre el otro disco 
restituyen la razón a su valor mínimo. La tasa de oscilación entre los dos discos dependerá de 
factores tales como la magnitud del incremento impuesto a la razón después de cada 
reforzamiento, así como el número de respuestas sobre el segundo disco requeridas para reducir 
la razón. Estas dos variables pueden equilibrarse de modo que den lugar a casi todas las tasas de 
oscilación posibles entre los dos discos. 36 Los experimentos de este tipo indican que la oscilación 
de respuestas está controlada por factores especificables y manipulables, y no constituye, tal 
como muchos teóricos han tendido a suponer, un foco de variabilidad irreductible o intrínseca. 
Así, a medida que se lleven a cabo con más frecuencia experimentos sobre respuestas múltiples, 
podremos esperar una mejor comprensión de este aspecto de la variabilidad. 


Otros experimentos han demostrado que la variabilidad de respuesta puede derivarse de la 
restricción inadecuada de la contingencia de reforzamiento. El caso extremo es aquel en que el 
reforzamiento se presenta independientemente de cualquier forma particular de conducta, de 
modo que cualquier conducta que se esté emitiendo en el momento en que se produce el 
reforzamiento aumentará de frecuencia, aunque la topografía de la conducta accidentalmente 
reforzada mostrará una desviación gradual.*? Ello se debe a que pueden resultar reforzadas ligeras 
variaciones de la respuesta, dado que el reforzamiento es, de hecho, independiente de cualquier 
forma de conducta especificada de antemano. Después de un período de tiempo suficientemente 
largo, la respuesta que en un principio fue “atrapada” por el reforzamiento puede incluso resultar 
irreconocible dentro de la pauta conductual mantenida en aquel momento. 


En la mayor parte de los experimentos la situación es algo más restringida, aunque suele haber 
una considerable laxitud. Así, por ejemplo, cuando se especifica una respuesta con la expresión 
“apretar la palanca”, la conducta está restringida únicamente a aquellas acciones que logran hacer 
descender la palanca. La respuesta a la palanca puede, de hecho, variar dentro de una amplia 
topografía, incluyendo respuestas de distinta fuerza y duración, así como las ejecutadas con 
diferentes partes del cuerpo. 


No está claro, por el momento si la variabilidad que resulta de la restricción insuficiente de las 
contingencias de reforzamiento constituye un problema de técnica experimental o es un factor 
que debe tenerse en cuenta al formular las leyes conductuales. Dado que disponemos de pocos 
datos experimentales relativos a esta cuestión, su formulación usual se hace con referencia a la 
definición de respuesta. Así, cuando una respuesta se define por sus consecuencias, o sea, el 
reforzamiento, surge el problema de si una definición en términos, pongamos por caso, de sus 
características físicas hubiera dado lugar a un tipo de sistematización conductual distinto, y quién 
sabe si más eficaz. Parece probable que, a largo plazo, la solución a este problema será una 
solución intermedia, de modo que las respuestas se definirán en términos de las contingencias de 
reforzamiento dentro de las cuales se incluyan, aunque las leyes conductuales también 
contendrán enunciados que describan los efectos de la variabilidad permisible en las propiedades 
de las respuestas. Esta variabilidad no puede eliminarse por completo mediante algún tipo de 
refinamiento de las técnicas experimentales, como no sea transformando al sujeto en un 
preparado quirúrgico sobre el que no tengan ningún efecto las contingencias de reforzamiento. 
El problema con que nos enfrentamos es de corte empírico, consistente en determinar si, y de qué 
modo, la restricción cuantitativa o cualitativa, o de ambos tipos a la vez, de la variabilidad de 
respuesta requerirá cambios en nuestra comprensión descriptiva de la conducta. Puede resultar 
que no sea necesario efectuar ningún cambio de este tipo, sino que un aumento en dicha 
restricción simplemente agudícela precisión de nuestras técnicas descriptivas actuales. 


LA VARIABILIDAD Y LA CONDUCTA ADAPTATIVA 


Muchos autores han resaltado el hecho de que si los organismos no mostraran variabilidad alguna 
en su conducta, no sobreviviríian durante mucho tiempo, dado que el ambiente no es nunca 
constante, y ningún organismo se enfrenta exactamente con la misma situación dos veces. Así, se 
requiere que la conducta sea cambiante a fin de tratar eficazmente con un ambiente igualmente 
cambiante. Los hospitales psiquiátricos están llenos de gente que fueron incapaces de afrontar 
nuevas situaciones mediante cambios apropiados en su conducta, y en una sociedad menos 
protectora la estereotipia llevaría a la muerte. Estas observaciones han contribuido, por desgracia, 
a generar una filosofía del indeterminismo con respecto a la conducta. Dado que la naturaleza 
requiere variabilidad para la supervivencia, se supone que aquellos organismos que ha conservado 
la vida se hallan intrínsecamente dotados de variabilidad conductual. 


La variabilidad no puede, evidentemente, negarse como hecho, pero como principio fundamental 
de la conducta merece un examen más detenido. La simple observación de que un fenómeno 
conductual cumple con la más útil función de preservar la existencia de un organismo, o de su 
especie, no es razón suficiente para tomar el fenómeno en cuestión como punto de partida en el 
análisis de la conducta. La variabilidad, del modo que la he descrito en las páginas precedentes, 
tiene su origen en muchas fuentes, y es susceptible de ser analizada. De hecho, su análisis ha 
constituido una provechosa aventura científica. 


El error básico que se comete al aceptar la variabilidad como punto de partida del análisis de la 
conducta es el no saber distinguir entre función útil y proceso sujeto a leyes. El conocimiento de 
que la conducta cumple con una función, o de que tipos distintos de conducta cumplen con 
distintas funciones en un organismo, resulta útil en muchos sentidos. Así, por ejemplo, cuando 
algún remoto o anónimo genio se dio cuenta de que todos los organismos precisan comer para 
sobrevivir, el conocimiento biológico sufrió un avance cuya magnitud probablemente no se ha 
igualado desde aquella ocasión. Sin embargo, resulta que ningún organismo individual emite la 
conducta de busca comida con vistas a cumplir con la misión de preservar la especie a que 
pertenece. Aunque la función de tal conducta puede conceptualizarse dentro del marco grandioso 
de la evolución, los procesos que controlan, y a su vez son controlados por la conducta de buscar 
comida, abarcan, como mínimo, parte del objeto de estudio de varias ciencias biológicas, desde la 
biofísica hasta la psicología. 


La variabilidad conductual cae dentro de una categoría similar. Las especies cuya conducta resultó 
demasiado estereotipada para permitirles enfrentarse con éxito a unas condiciones ambientales 
alteradas, ya no existen para contarlo. Las únicas excepciones a esta situación son aquellas 
especies, tales como algunos peces, que disponen de pulmones y agallas al mismo tiempo y cuyo 
ambiente no ha sufrido ninguna alteración apreciable. Sin embargo, nos encontramos de nuevo 
con que ningún ejemplo individual de variabilidad conductual puede comprenderse 
exclusivamente por su función de preservar la especie, si es que tal función puede observarse en 
absoluto. La investigación experimental de la variabilidad desvela procesos conductuales cuya 
descripción da lugar a leyes de la conducta. La variabilidad puede ser un componente de tales 
leyes, o bien una consecuencia de ellas, de modo que debe buscarse una explicación de la 
variabilidad en las condiciones bajo las que tienen lugar los procesos conductuales y en los 
factores que determinan sus características, puesto que la función adaptativa de la variabilidad es 
sólo un subproducto afortunado de los procesos conductuales subyacentes. 


En realidad, incluso el hecho de buscar la función adaptativa de toda muestra de conducta, puede 
constituir un error fundamental, y, dado que el proceso evolutivo ha eliminado, en su mayor 
parte, aquellos organismos y especies cuya conducta no cumplía con dicha función, siempre 
basaríamos nuestras observaciones en una muestra falseada. Vemos a nuestro alrededor 
organismos cuya conducta se halla bajo el control de procesos que facilitan la supervivencia, 
aunque cuando examinamos la conducta en el laboratorio aparecen otros procesos que van en 
contra de dicha supervivencia. En este caso, permitimos sobrevivir a los animales en los que 
nuestras manipulaciones experimentales generan procesos no adaptativos, y ponemos de relieve 
la existencia real de dichos procesos. 


Podemos tomar como ejemplo la conducta generada y mantenida por el programa de razón fija. 
En general, este programa genera una tasa de respuesta extremadamente alta, pero si la razón de 
respuestas a reforzamiento impuesta sobre el animal es demasiado grande, éste para de 
responder. Supongamos que obligamos a una rata a obtener toda su comida apretando una 
palanca, de modo que cada cincuenta respuestas a la palanca le proporcione una pequeña 
cantidad de un preparado alimenticio especial, conteniendo todos los ingredientes necesarios para 


una manutención saludable. Bajo estas condiciones, la mayoría de ratas se mantendrán vivas 
indefinidamente. Aumentemos ahora, súbitamente, el trabajo requerido de la rata de 50 a 500 
respuestas a la palanca por reforzamiento. La conducta del animal se mantendrá durante un cierto 
tiempo en su tasa normalmente alta, pero se desarrollarán pausas cada vez más largas hasta que 
el animal responda con una frecuencia tan baja que su ingestión de comida no sea suficiente para 
mantenerla con vida. A la larga, el animal morirá de inanición. 


En este ejemplo, el ambiente sufrió, de hecho, un cambio, pero de naturaleza tal que resultó 
imposible a la rata procurarse una cantidad de comida adecuada. A pesar de que la nueva 
contingencia de reforzamiento no era capaz de mantener la alta tasa de razón fija en la conducta 
de apretar la palanca, el animal habría podido proseguir a una tasa más baja y todavía continuar 
proporcionándose la suficiente comida para compensar holgadamente su gasto de energía. 
Sin embargo, la rata muere de hambre en medio de la abundancia por causa de los procesos 
conductuales específicos generados por los programas de reforzamiento de razón fija. Cuando el 
reforzamiento se hace depender de la emisión de un número de respuestas fijo, ciertas variables s 
combinan de tal modo que producen, o bien una alta tasa de respuesta, o bien una tasa nula. 
Si prevalece la segunda, ninguna consideración a largo plazo sobre la supervivencia del organismo 
o de la especie alterará el proceso. De este modo, los procesos demuestran ser más poderosos 
que la función que cumplen. 


En principio, casos similares pueden ser los responsables de la conducta no adaptativa que nos 
fuerza a confinar una gran porción de nuestra población en instituciones mentales. Muchos 
psiquiatras parten del supuesto que la conducta que emiten sus pacientes, a pesar de que es 
evidentemente inadecuada para la supervivencia física, posee, de hecho, algún tipo de función 
adaptativa. Debido a ello, suele orientarse la terapéutica hacia la búsqueda de esta función oculta, 
probablemente idiosincrática. 


Por ejemplo, el paciente que prácticamente no emite en absoluto ninguna conducta es 
considerado, a veces, como el resultado de una historia conductual en la que casi toda la conducta 
emitida ha recibido castigo o trauma de algún tipo, real o imaginado. La pérdida subsiguiente de 
toda la conducta se considera como una adaptación a un ambiente en el que “no responder” es la 
única acción segura. Sin embargo, también es posible que este paciente esté simplemente 
emitiendo la respuesta automática y normal ante un ambiente que no ha logrado proporcionarle 
un reforzamiento lo suficientemente frecuente, debido a lo cual el proceso de extinción 
conductual puede haber resultado tan poderoso que haya llegado a contrarrestar la función de 
supervivencia de la conducta. Esta distinción es importante en la práctica, al igual que como 
principio conductual, dado que el tipo de terapéutica que debe emplearse diferirá marcadamente, 
según cual sea entre las dos posibilidades, la supuesta por el psiquiatra. 


A pesar de que ha sido tradicional considerar la variabilidad como una propiedad fundamental de 
la conducta que permite la adaptación a un ambiente cambiante, es posible enfocar de un modo 
distinto la relación entre el ambiente y la variabilidad. Así, en lugar de considerar la variabilidad 
adaptativa como un fenómeno primario, admitimos la posibilidad de que esté impuesta por el 


ambiente. Ello implica una sutil inversión en cuanto al énfasis otorgado a una u otra cosa, ya que 
en vez de evaluar la variabilidad con referencia a su función adaptativa en el control del ambiente, 
podremos considerarla como el resultado de un medio ambiente en continuo cambio, de modo 
que su función adaptativa resulte secundaria. 


El ambiente puede dar lugar a variabilidad conductual de muchas maneras, entre las cuales la más 
directa sería la fuerza bruta. Así, un organismo puede descubrir que una respuesta tiene éxito la 
primera vez que se encuentra ante una situación dada, aunque la próxima vez que surja dicha 
situación su conducta original no tenga ningún efecto. Todo padre que observe el desarrollo 
conductual de sus hijos con marcado interés, ha visto casos en que tiene lugar este proceso. 
Por ejemplo, un bebé de nueve meses tal vez haya descubierto que puede provocar sonrisas y 
caricias por parte de sus padres mediante un pequeño truco, tal como dar palmaditas. 
Ocasionalmente, si sus padres están preocupados, el truco no funciona. Sin embargo, llorar puede 
resultar eficaz allí donde fracasaron las palmadas. Más adelante, otro truco distinto, “decir adiós 
con la mano” puede obtener el mismo resultado. En otras ocasiones, el niño sólo necesitará hacer 
una gran sonrisa. Cada una de estas formas de conducta se ha condicionado por separado, y 
cualquiera de ellas puede producirse en el ambiente paterno, de modo que, de hecho, alguna vez 
puede observarse cómo el niño produce rápidamente toda la secuencia de palmadas, lloros, 
sonrisas y “adioses con la mano”, hasta que le llega el reforzamiento acostumbrado. 


Casos similares pueden multiplicarse en la historia conductual de un organismo a lo largo de toda 
su vida, hasta el punto en que resulte imposible desentrañar los sistemas entrelazados 
constituidos por múltiples respuestas directamente condicionadas. Respuestas distintas pueden 
resultar reforzadas en ambientes de apariencia similar, mientras que otros ambientes, al parecer 
distintos, ocasionalmente diversiforme, puede ser altamente adaptativa, a pesar de un propósito 
de adaptación. Las variaciones conductuales se han condicionado directamente, y sólo resultan 
adaptativas en la medida en que el ambiente continúa reforzándolas siguiendo las mismas normas 
que prevalecían en su condicionamiento. 


¿Qué sucede cuando estas normas cambian, y la conducta que en un principio resultaba apropiada 
se transforma en ineficaz? La evidencia experimental indica que el proceso de extinción da lugar a 
un aumento de variabilidad en la conducta.? Nos encontramos, pues, ante un mecanismo 
conductual que también parece estar diseñado con vistas a la supervivencia, dado que a menos 
que los organismos puedan desarrollar nuevos modos de proceder cuando el ambiente es incapaz 
de reforzar tipos de conducta originalmente adecuados, sus oportunidades de sobrevivir 
resultarán seriamente disminuidas. Así, pues, la variabilidad producida por la extinción constituye 
un mecanismo de adaptación tan bueno como cualquier otro que se haya podido observar en 
otras áreas de la biología. 


Sin embargo, podemos encontrarnos de nuevo con la función adaptativa sea solamente 
secundaria con respecto a un proceso de condicionamiento directo. Aunque los datos 
experimentales de que disponemos sobre esta cuestión son pocos, se ha sugerido que las 
variaciones que tienen lugar durante la extinción constituyen formas de conducta que, en el 


pasado, habían sido reforzadas por sí mismas,** y el hecho de que este reforzamiento fuera sólo 
incidental, o incluso accidental, no disminuye su efectividad. El reforzamiento se produce, 
típicamente, cuando la conducta produce un cierto efecto final, pero probablemente existan muy 
pocas restricciones al camino que sigue una secuencia conductual para llegar a término. 


Un jugador de ajedrez recibe su premio después de haber colocado el rey de su adversario en una 
situación insostenible, pero la gran variedad de pasos posibles con que se puede conseguir este 
objetivo, hace del juego una fuente de deleite inagotable para sus aficionados. Así, un jugador con 
experiencia, cuando se encuentra con un oponente que no es vulnerable a su estrategia favorita, 
dispone de un repertorio reforzado de otras jugadas entre las cuales puede escoger. 
La variabilidad adaptativa exhibida por un maestro es el resultado, duramente ganado, de una 
larga historia de reforzamiento y extinción, y este principio se tiene en cuenta en la construcción 
de máquinas que juegan al ajedrez. La probabilidad de que una de estas máquinas haga una 
jugada determinada, no sólo depende de la distribución momentánea de las piezas sobre el 
tablero, sino también de las consecuencias que habían tenido en el pasado jugadas similares bajo 
circunstancias parecidas. 


Al igual que el jugador de ajedrez, el animal de laboratorio puede variar sus respuestas en muchas 
direcciones, siempre y cuando produzcan el efecto requerido. Así, las respuestas de apretar una 
palanca pueden variar en fuerza y duración, pudiéndose ejecutar con cualquiera de sus patas, con 
su hocico, e incluso con la cola, y pueden haber ido precedidas de cualquier otra respuesta del 
repertorio del animal. Sin embargo, en tanto en cuanto la conducta logre cerrar el interruptor 
incorporado a la palanca, el reforzamiento se administrará. A la larga, la conducta de apretar la 
palanca queda relativamente restringida en su forma, pero la historia de reforzamiento de las 
variaciones iniciales puede ponerse de manifiesto en un proceso de extinción. El estudio 
cuantitativo debería revelar la existencia de una correlación entre las distintas formas desviadas 
de respuesta, observadas durante la extinción, y la historia de reforzamiento de estas variaciones. 


Si la amplitud permitida por la contingencia de reforzamiento inicial fue lo suficientemente 
grande, es probable que la variabilidad producida por la extinción permita al animal emitir una 
forma de respuesta eficazmente modificada. Sin embargo, si las nuevas contingencias de 
reforzamiento requieren una conducta sin relación con las formas reforzadas anteriormente, el 
organismo tal vez sucumba. Cuando el ambiente hace que el reforzamiento sea contingente a 
formas restringidas de conducta, reduce a la vez la “reserva” conductual que se necesitará al 
cambiar los requerimientos. 


El control ambiental de la variabilidad de la conducta puede seguir aún otro curso. Si las 
contingencias de reforzamiento cambian frecuentemente, podemos esperar que tenga lugar un 
grado de variabilidad conductual correspondientemente mayor, de modo que en un ambiente que 
requiera un reajuste constante a las condiciones cambiantes, la variabilidad puede convertirse en 
la característica más sobresaliente de la conducta. En algunas circunstancias, la propia variabilidad 
puede resultar condicionada, o sea, que el reforzamiento puede ser contingente, no sólo a la 
emisión de una respuesta dada en presencia de un estímulo dado, sino también a la emisión de 


conducta variable. En estos casos, la variabilidad será la regla y no la excepción, dado que 
constituirá el requerimiento primordial para que tenga lugar el reforzamiento. Así, la conducta 
eficazmente creadora, en la ciencia, el arte, y en muchas otras áreas, tiene un poderoso 
componente de variabilidad condicionada. Una constante lección que la ciencia enseña, es que las 
soluciones a problemas teóricos o experimentales con frecuencia exigen la renovación de los 
modos de pensar tradicionales, y aquellos científicos que continuamente ponen en duda las 
formulaciones tradicionales y los enfoques ortodoxos, muestran los efectos de una historia de 
reforzamiento de la variabilidad conductual, han aprendido que cuando las antiguas respuestas 
resultan ineficaces, deben intentarse otra nuevas. 


La variabilidad condicionada tiene un indudable valor de supervivencia —fijémonos en los animales 
de presa, en el estratega militar, en el amante, así como en el científico creador. En estos casos, la 
variabilidad conductual resulta de un valor adaptativo tan obvio que es fácil dar por sentado que 
sólo diciéndolo ya la hemos explicado. Sin embargo, la afirmación de que la variabilidad 
conductual tiene valor de supervivencia constituye, en realidad, un enunciado sobre la 
disponibilidad del reforzamiento. La conducta tiene valor de adaptación en la medida en que 
asegura los reforzamientos que mantienen al organismo con vida, con salud o en el campo de 
acción que ha escogido. Si debemos comprender la función adaptativa de la variabilidad 
conductual, debemos investigar, en primer lugar, las relaciones entre la conducta y la historia de 
reforzamiento. La variabilidad puede ser condicionada, pero las formas de conducta particulares 
que emergen en los distintos estadios de una secuencia variable están en función de contingencias 
que deben especificarse. 


He aquí, pues, el problema básico implicado en la explicación de cualquier caso dado de 
variabilidad, ya sea a un nivel de creación científica. ¿Cuáles son las variables históricas y 
momentáneas concretas que dieron lugar a la conducta eficaz? Reconocer simplemente la función 
adaptativa de la variabilidad conductual no nos ayuda a responder a esta pregunta. 


GENERALIZACIÓN DE ESTÍMULOS E INDUCCIÓN DE RESPUESTAS 


Dos fenómenos que parecen ser ejemplos de variabilidad fundamental y poseer una evidente 
función adaptativa son la generalización de estímulos y la inducción de respuestas. 
Las observaciones básicas que definen estos fenómenos se conocen desde hace muchos años, 
pero hasta hace poco tiempo no habían atraído apreciablemente la atención experimental. 
El experimento que demuestra la generalización de estímulos en su forma cuantitativa mente más 
precisa es el siguiente:* 


Se coloca una paloma hambrienta en un recinto experimental con poca luz, con un disco 
iluminado, o pulsador, situado en una pared del mismo. Picoteando sobre este disco, la paloma 
puede conseguir una pequeña cantidad de grano. Una vez que el sujeto ha aprendido a picar sobre 


el disco, se programa el reforzamiento bajo un intervalo variable, es decir, que la respuesta de 
picar consigue comida a intervalos de tiempo espaciados irregularmente. Durante las fases del 
experimento en que la respuesta es reforzada, la luz de disco se mantiene a una longitud de onda 
constante, pongamos por caso, de 550 milimicras. 


La siguiente y decisiva fase del experimento se lleva a cabo bajo condiciones de extinción 
experimental, desconectándose el mecanismo proveedor de comida de modo que la paloma no 
reciba más reforzamiento en el recinto experimental. En la primera fase se utilizó el programa de 
reforzamiento de intervalo variable por su conocida propiedad de generar una gran resistencia a la 
extinción de la respuesta previamente condicionada, es decir, que la conducta de picar sobre el 
disco persiste a una tasa relativamente constante hasta bastante tiempo después de haberse 
interrumpido el reforzamiento. Durante el período de extinción, en el cual suele mantenerse una 
tasa estable, el color de la luz de disco se hace variar sistemáticamente a lo largo de una amplia 
zona del espectro. Los colores se cambian con frecuencia, pero cada uno de ellos se presenta 
durante un período de tiempo total equivalente, de modo que podamos comparar directamente el 
número de respuestas al disco en presencia de cada color. 


Los resultados obtenidos con una sola paloma aparecen en la figura 20. Se observa que el número 
de respuestas de extinción más elevado se emitió cuando la longitud de onda de la luz de disco era 
de 550 milimicras, valor que coincide con el que estaba presente durante la fase de reforzamiento 
bajo el programa de intervalo variable. Por otra parte, cuanto más difiere la longitud de onda de 
dicho valor, más disminuye el número de respuestas de extinción emitidas. Se ha denominado a 
esta curva “gradiente de generalización”, dado que demuestra que el sujeto responde no sólo a 
los estímulos que estuvieron presentes durante el reforzamiento, sino también ante otros a los 
que nunca había estado expuesto en esta situación particular. Sin embargo, a medida que los 
estímulos divergen del original, la probabilidad de respuesta disminuye. 


El gradiente de generalización constituye un mecanismo por medio del cual la conducta puede 
adaptarse a un ambiente que nunca repite una combinación de estímulos de un modo exacto. Si 
una forma de conducta eficaz estuviera únicamente bajo el control de las circunstancias precisas 
que estuvieron presentes en el momento en que aquélla adquirió, deberíamos volver a aprender 
la conducta cada vez que tuviera lugar la situación original con sus inevitables variaciones. Keller y 
Schoenfeld lo han anunciado muy claramente: 


Nuestro ambiente se halla bajo una continua fluctuación, debido a la cual es muy poco probable que un 
estímulo se repita nunca de forma idéntica. Los estímulos visuales que presenta un conejo corriendo a la 
zorra que lo persigue, o la cara de un amigo al mirarla en distintos momentos, están sujetos a incontables 
variaciones en sus líneas, movimientos, brillo, y muchos otros factores. A pesar de ello, la zorra continúa su 
caza, y a nadie le parece estar ante una procesión de desconocidos. En este ambiente de perpetuo cambio, 
la generalización de estímulos confiere estabilidad y coherencia a nuestra conducta (51, página 116). 
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FIGURA 20. Gradiente de generalización de un estímulo. (Adaptado de Guttman y Kalish, 39.) 


A pesar de que el gradiente de generalización cumple con la función de producir una conducta 
coherente también acarrea, en sí mismo, una fuente da variabilidad. Tal como se muestra en la 
figura 20, la probabilidad de que se emita una respuesta apropiada no es constante a lo largo de 
todo el intervalo de variación del estímulo. En la naturaleza se pueden presentar con frecuencia 
situaciones marcadamente distintas que requieran, sin embargo, la misma conducta, y la 
probabilidad de que se emita la conducta apropiada decrece a medida que las situaciones difieren 
más profundamente. Debido a ello, la variabilidad conductual puede producirse allí donde se 
requería una conducta regular. 


Además, toda situación, ya sea en el laboratorio o en el mundo exterior, contiene muchos 
estímulos, cada uno de los cuales puede variar en multitud de direcciones distintas, con lo que la 
interacción de gradientes de generalización constituye una fuente potencial de variabilidad en la 
conducta, cuya influencia apenas hemos comenzado a estudiar. Se han llevado a acabo 


[pits 


observaciones en el laboratorio sobre el “predominio” de un estímulo sobre otros con respecto al 
grado de control ejercido sobre la conducta, aunque nada se sabe acerca de los gradientes de 
generalización que interactúan de tal modo que dan lugar a dicho predominio. Este campo es 
realmente fascinante, y su exploración reportará, a no dudar, valiosos progresos a nuestra 


comprensión y control de la variabilidad conductual. 


Se han observado casos sorprendentes de predominio de estímulos de los cuales se esperaría 
normalmente un efecto débil. Un experimento sobre conducta de evitación, utilizando un mono 
como sujeto, proporcionó un ejemplo de ello.* En este experimento se señalaba el comienzo de 
cada sesión experimental mediante una luz roja centellante, que permanecía conectada durante 
toda la sesión. Cuando terminaban los destellos, se había acabado e experimento hasta el día 
siguiente, y el animal podía descansar. Después de haber adquirido un poco de experiencia, el 
mono iniciaba normalmente una tasa estable de respuestas de evitación tan pronto como 
aparecían los destellos. Un día, sin embargo, se produjo una avería en el equipo eléctrico, debido a 


la cual el dispositivo que producía los destellos dejó de funcionar; y en lugar de la luz centellante 
apareció una luz roja fija. 


Bajo estas circunstancias, parecía razonable espera que se produjera una tasa más baja de lo 
normal al principio, o incluso nula, y que se incrementara inmediatamente tan pronto como el 
animal recibiese algunos shocks, ya que parecía lógico esperar que el shock ejerciera un control 
más poderoso que la luz centelleante en esta situación. Sin embargo, lo que le mono hizo fue 
sentarse y recibir varios cientos de shocks, uno cada 20 segundos, sin emitir una sola respuesta de 
evitación. El pequeño cambio de una luz roja centelleante a otra fija ocasionó un profundo 
desplazamiento a lo largo del gradiente de generalización —probablemente el de la tasa— de los 
destellos. Ello sucedió a pesar del hecho de que otras variables demostradamente poderosas, tal 
como el shock, no habían variado. A no dudar, casos similares se presentan continuamente, en 
mayor o menor grado, en muchos experimentos conductuales, y mientras los datos sobre la 
generalización permanezcan en el misterio, continuará aplicándose el concepto de variabilidad 
intrínseca. Los mejores experimentos que se han llevado a cabo en esta área indican que la 
generalización es un fenómeno sometido a leyes, con lo cual la interpretación de este proceso en 
términos de su función adaptativa y no adaptativa conducirá eventualmente a un análisis 
funcional basado en el tipo de datos cuantitativos que aparecen en la figura 20. 


La inducción de respuestas se considera, a veces, como la contrapartida de la generalización de 
estímulos en el terreno de las respuestas.*! La siguiente observación experimental constituye un 
ejemplo típico del reducido número de mediciones que se han realizado de los gradientes de 
inducción. En este experimento,” una rata hambrienta recibía un gránulo de comida cada vez que 
apretaba una palanca. Sin embargo, las contingencias de reforzamiento contenían una restricción 
importante: la presión ejercida sobre la palanca tenía que ser de 21 gramos o más para que la 
respuesta obtuviese reforzamiento. Se registró la presión ejercida en cada respuesta a la palanca, 
y la distribución de frecuencias de las presiones ejercidas en una serie de 100 reforzamientos se 
ilustra en la parte superior de la figura 21. En esta distribución puede observarse una considerable 
variabilidad, con presiones que van desde los 13 hasta los 45 gramos. Tal variabilidad tiene una 
gran utilidad con vistas a la adaptación, dado que el ambiente rara vez requiere conductas con 
propiedades estrechamente delimitadas. Las habilidades altamente perfeccionadas se aproximan 
a una precisión muy estricta, como ocurre, por ejemplo, al tocar el piano con calidad de 
concertista. Por lo general, sin embargo, no sólo son permisibles amplias variaciones en una forma 
dada de conducta, sino que de hecho se requieren. Puesto que las dimensiones de las ambiente 
sufren variación, la conducta debe también variar de un modo correspondiente si ha de resultar 
eficaz. 


La inducción de respuestas constituye uno de los mecanismos de adaptación más armoniosos que 
el análisis de la conducta ha descubierto. Supongamos que el ambiente cambia de tal modo que a 
partir de un momento dado se requiere una conducta con propiedades que nunca habían 
aparecido anteriormente en el repertorio del organismo. Echando una hojeada a la distribución 
que aparece en la parte superior de la figura 21, podríamos preguntarnos qué ocurriría si la 
presión requerida aumentará súbitamente desde los 21 gramos originales hasta 57 gramos o más. 


Dado que nunca se observan presiones de esta magnitud, la conducta probablemente se 
extinguiría por falta de reforzamiento, y es de esperar que, si tuviera que obtener toda su comida 


en esta situación experimental, el animal también se extinguiría, juntamente con su conducta de 
apretar la palanca. 
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INTENSIDAD DE PRESIONES EXPRESADA EN GRAMOS 


FIGURA 21. La distribución de frecuencias superior ilustra las variaciones observadas en la presión 
de ejercida por una rata al apretar una palanca. Todas las respuestas a la palanca de intensidad 
igual o superior a 21 g. proporcionaron un gránulo de comida de al animal. La distribución inferior 


muestra los cambios que se produjeron al aumentar la presión mínima necesaria a 38 g. (De Hull, 
47, p. 305.) 


Supongamos, sin embargo, que comenzamos seleccionando una presión de 38 gramos como 
nuevo punto limite. Dado que el animal emite ocasionalmente alguna respuesta con una presión 
de 38 gramos o más, cabe esperar que reciba algún reforzamiento. Los resultados de esta nueva 
exigencia se ilustran en la distribución inferior de la figura 21, donde podemos observar que la 
distribución se ha desplazado acusadamente hacia la derecha, donde se sitúan las presiones altas. 
El intervalo de variabilidad también ha aumentado, pero podemos observar algo más importante 
todavía: la existencia de valores de la presión ejercida sobre la palanca que no se habían registrado 
previamente. Así, desplazando la presión requerida a un punto situado dentro del intervalo 
normal de variación, se ha podido dar lugar a una nueva conducta, gracias a la cual resulta posible 
ahora reforzar únicamente aquellas respuestas a la palanca de una presión de 57 gramos o más. 


Por medio de este procedimiento se han obtenido presiones sobre la palanca equivalentes al peso 
del animal. 


Tal como Keller y Schoenfeld lo enunciaron, “El reforzamiento de una respuesta de una cierta 
intensidad basta, aparentemente, para fortalecer respuestas topográficamente similares de 
intensidades muy diferentes” (51, página 171). Sin embargo, el “por qué” de la inducción de 
respuestas aún no ha sido resuelto satisfactoriamente. Una razón de ello es el hecho de que nunca 
se ha examinado en el laboratorio un caso puro de inducción de respuestas. Así, por ejemplo, en el 
experimento cuyos resultados se ilustran en la figura 21, la inducción fue indudablemente la 
responsable de la aparición inicial de nuevas respuestas cuando se aumentó la presión requerida, 
pero cuando estas nuevas respuestas aparecen, se mantienen, consiguientemente, por el 
reforzamiento directo que consiguen, con lo que dejan de constituir un caso de inducción. 
El problema se convierte, de hecho, en explicar por qué aparecen tan raramente. 


Hasta que no se logre aislar u caso de inducción incontaminado, la variabilidad procedente de este 
foco permanecerá poco comprendida, y el fenómeno continuará clasificándose superficialmente 
de “mecanismo de adaptación”. Sin embargo, una demostración genuina de inducción de 
respuestas, lograda mediante una técnica experimental refinada, probablemente irá acompañada 
de una disminución en el nivel da variabilidad atribuible a la inducción. En un experimento como el 
de la figura 21, por ejemplo, podríamos imponer un doble límite, superior e inferior, a la presión 
de respuesta que ocasiona el reforzamiento, de modo que en vez de reforzar todas las presiones 
superiores a 38 gramos, reforzáramos solamente aquellas que se situaran entre los 38 y 41 
gramos. De este modo, cualquier respuesta de una presión superior a 41 gramos constituiría un 
caso de inducción mucho menos contaminado, y no hay duda de que se reduciría apreciablemente 
el intervalo de variabilidad. Otro factor que se debería eliminar es el reforzamiento de ciertas 
secuencias, puesto que, por ejemplo, si las respuestas “correctas” van precedidas de un modo 
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característico por una o más respuestas “incorrectas”, podemos estar reforzando las segundas 
como miembros de una cadena accidental. Tal vez la eliminación de esta posibilidad haría 


disminuir aún más el nivel de variabilidad que normalmente atribuimos a la inducción. 


Puede darse el caso de que, en realidad, la inducción de respuestas, a pesar de su utilidad 
adaptativa, sólo contribuya de un modo muy secundario a la variabilidad conductual. Es probable 
que su efecto sea substancialmente indirecto, en tanto en cuanto ocasiona la aparición inicial de 
nuevas conductas que subsiguientemente caen bajo las contingencias de reforzamiento y pasan a 
ser mantenidas de un modo directo. 


Sección IV 


Diseño experimental 


En los capítulos que anteceden he considerado de un modo más o menos general los problemas 
que surgen al evaluar datos experimentales. Voy a intentar indicar, de aquí en adelante, de qué 
modo aquellas consideraciones se incorporan al diseño y puesta en práctica de experimentos 
concretos. Al presentar ejemplos como ilustración, echaré mano de experimentos reales allí 
donde sea posible, aunque ocasionalmente me veré obligado a apelar a demostraciones 
hipotéticas. 


El uso de experimentos publicados para esclarecer un principio cualquiera de diseño experimental 
tiene la ventaja de proporcionar al estudiante las fuentes de información técnica de donde puede 
obtener descripciones relativamente detalladas de procedimientos experimentales, a las cuales 
pueda referirse en cuanto tenga necesidad de ellas. Existe, por otra parte, el peligro de que los 
experimentos que se citan como buenos ejemplos de una técnica dada se vean revestidos de un 
“halo de perfección” indebido. Escasísimos experimentos son ejemplificadores en todos sus 
aspectos, y casi siempre ocurre que un experimento escogido por ciertas características 
interesantes resulta deficiente en otros aspectos. Doy un énfasis especial a este hecho en parte 
para que el lector se mantenga en una postura crítica y en parte también para absolverme de 
antemano a mí mismo del cargo de inmodestia que se me podría hacer cuando cite mis 
experimentos, u otros con los que esté yo relacionado, como ejemplos de técnicas deseables. 
Los ejemplos que cito se han extraído, necesariamente, de aquellos campos con los que estoy 
más familiarizado. He intentado, de todos modos, que los problemas y soluciones a los cuales 
ilustran ejemplifiquen a su vez principios generales. Aquellos lectores que tengan interés y sean 
técnicamente competentes en otros dominios no deberán encontrar gran dificultad en traducir 
los ejemplos citados a su ámbito de competencia. 


Una posibilidad que resultaría todavía más preocupante consiste en aceptar los ejemplos como 
constituyentes de un conjunto de reglas que deben seguirse en el diseño de nuevos experimentos. 
Todo énfasis es poco al advertir que ello resultaría desastroso. Podría citar también el vulgar dicho 
de que toda regla tiene su excepción, aunque a pesar de todo, esto no sería suficiente, como 
tampoco lo es afirmar que las reglas del diseño experimental son flexibles, y, por consiguiente, 
deben aplicarse sólo donde convengan. La pura verdad es que el diseño experimental no tiene 
reglas. 


Todo experimento es único, y se lleva a cabo para averiguar algo que todavía desconocemos. 
Si conociéramos de antemano los resultados, no tendría ningún objeto efectuar experimentos. 
En nuestra búsqueda de nueva información debemos estar preparados para alterar, en cualquier 
momento, la concepción que teníamos acerca de lo que es deseable en el diseño experimental. 
La naturaleza no descubre sus secretos fácilmente, y cada nuevo problema de investigación 
requiere sus técnicas propias. A veces las técnicas adecuadas serán las mismas que las empleadas 


en otras ocasiones, pero con mucha más frecuencia deberán modificarse los métodos conocidos, 
y en más de una ocasión será necesario idear nuevos principios de diseño y de procedimiento 
experimentales. Se concluye, pues, que no existe regla alguna para indicar al experimentador en 
cual de estas eventualidades se va a encontrar. 


Una vez enfrentado a un problema de diseño experimental, el investigador se encuentra solo. 
Si halla que otros experimentadores se han enfrentado a problemas similares, debe entonces 
evaluar las soluciones ajenas a la luz de sus propios requerimientos, pudiendo resultar factible la 
elaboración de una decisión eficaz combinando su experiencia y la de los demás. Por otra parte, el 
problema pude resultar soluble sólo a través de procedimientos empíricos. Quizás el investigador 
se vea obligado a efectuar el experimento no sólo una, sino varias veces, introduciendo cada vez 
modificaciones más o menos importantes antes de obtener una solución satisfactoria. Es por esto 
que el diseño experimental adecuado no puede legislarse, ya sea utilizando principios lógicos o 
empíricos. 


VII. Estudios piloto 


Suele aplicarse el término “estudio piloto” o “estudio exploratorio” a los experimentos previos a 
una investigación de envergadura. Partiendo del tradicional enfoque en psicología de que todos 
los experimentos están orientados a comprobar alguna hipótesis, ha surgido la concepción de que 
los estudios piloto deben preceder a cualquier experimento definitivo. S el trabajo exploratorio no 
sugiere la confirmación de la hipótesis, es típico que el investigador o bien revise su plan de 
ataque experimental o bien abandone el problema y emprenda alguna otra investigación que le 
parezca más prometedora. La justificación de estos modos de proceder es simple, puesto que en 
la situación en que se halla el actual estado de teorización psicológica, el investigador siempre 
puede sacar a relucir alguna ambiguedad en su teoría que sirva de excusa a los resultados piloto 
negativos. Del mismo modo, y dado que las teorías psicológicas rara vez especifican con rigor 
apreciable los medios para que pueda procederse a su verificación, es posible demostrar en 
general que un estudio piloto negativo determinado no llegó a comprobar un cierto número de 
especificaciones post-hoc. La labor exploratoria se considera necesaria porque sirve para reducir al 
mínimo la cantidad de tiempo y esfuerzo que de otro modo se gastaría en comprobaciones de 
hipótesis incorrectas, o bien en comprobaciones inadecuadas de hipótesis correctas. 


Hay, sin embargo, un error de enfoque fundamental implicado en el uso de estudios piloto para 
obtener información previa, sin que por ello comporte un gran gasto, de lo que se supone serán 
descubrimientos experimentales más definitivos. ¿Cuál es la diferencia entre un estudio piloto y 
su sucesor más definitivo? El experimento piloto, si es precursor de un estudio estadístico de 
grupos, sólo puede utilizar un reducido número de sujetos, o bien puede utilizar sujetos con una 
historia experimental previa, mientras que el estudio proyectado requiere sujetos 
experimentalmente virgenes. Del mismo modo, los aparatos utilizados en un estudio piloto 
pueden estar sujetos a fallos ocasionales, fallos que nunca se tolerarían en un experimento de 
envergadura. El experimentado está poco dispuesto a emplear su mejor equipo, juntamente con 
una porción importante de su tiempo y atención, en una labor de desbroce que tal vez nunca le 
proporcione datos útiles o que sean publicables. 


Los estudios piloto concebidos de este modo poseen una curiosa propiedad. Se supone que han 
de proporcionar al investigador una estimación del éxito o fracaso probable de un subsiguiente 
experimento ben diseñado. Sin embargo, la característica definitoria de este tipo de estudio 
piloto es su falta de control sobre ciertas variables, aunque un control inadecuado se considera 
permisible en estos tipos de estudio, porque, después de todo, “Sólo queremos obtener una idea 
aproximada de cómo resultará nuestro experimento, y no tiene sentido derrochar tiempo y 
esfuerzo hasta que estemos razonablemente seguros de que merecerá la pena”. 


Sin embargo, si un estudio piloto no se lleva a cabo exactamente bajo las mismas condiciones que 
se requerirían en un experimento a gran escala, su valor de predicción queda completamente 
anulado. Así, por ejemplo, si las historias experimentales de los sujetos no se consideran factores 
importantes en un estudio piloto, ¿por qué molestarse en controlarlas en la investigación 


definitiva? Lo mismo puede decirse acerca de cualquier otra diferencia entre los experimentos 
exploratorios y los realizados a gran escala; los estudios piloto que no se lleven a cabo de un modo 
tan riguroso como sea posible, nunca tendrán un valor positivo o negativo como indicadores de 
los resultados subsiguientes. Un experimento chapucero siempre será un experimento 
desgraciado, y nunca podrá justificarse colgándole la etiqueta de “piloto”. 


Todo ello nos conduce inevitablemente a preguntarnos cuáles son las diferencias entre un estudio 
piloto y un experimento a gran escala. Si en ambos casos se han de llevar a cabo las mismas 
operaciones, ¿dónde está la diferencia? La respuesta es que no existe ninguna distinción bajo el 
enfoque con que he introducido este tema. 


Un experimento nunca se diseña deliberadamente como estudio piloto, sino que se designa así 
sólo después de realizado, y aun entonces sólo bajo ciertas condiciones. El hecho de que el 
experimento fracase en confirmar una hipótesis, no es una de estas condiciones, ni tampoco es 
permisible clasificar un experimento de exploratorio, y, por consiguiente, desecharlo en virtud de 
insuficiencias observadas en su desarrollo teórico. Si un experimento es técnicamente correcto, 
sus datos deben aceptarse, independiente de si son favorables o no, al propósito perseguido por el 
investigador al emprender el estudio. Si, por el contrario, un experimento es técnicamente 
inadecuado, los datos que de él se obtengan serán inaceptables, aun cuando apoyen las ideas 
preconcebidas del investigador. 


El primer paso en el diseño de un experimento consistirá, por lo tanto, en evaluar su adecuación 
técnica. El objetivo eventual del experimentador puede ser demostrar, o comprobar, una 
hipótesis, o simplemente puede interesarle conseguir una información nueva e impredecible. 
Sin embargo, e independientemente de su posible objetivo, el investigador debe dirigir su 
atención, de un modo primordial, a sus técnicas experimentales, y debe decidir cuáles serán las 
variables a controlar seleccionando al mismo tiempo los métodos apropiados para este control 
¿cuál deberá ser la línea de base a partir de la cual medir los cambios que tengan lugar, y qué 
medidas serán factibles y apropiadas para la conducta particular que se generará? ¿Resultará 
posible generar el tipo de conducta que sería de máxima utilidad en la investigación? 


Problemas como éstos son los que dan lugar a los estudios piloto, puesto que el experimentador 
desconoce con frecuencia las respuestas, y debe actuar “a tientas”, haciendo estimaciones, lo más 
exactas que pueda, de la adecuación y aptitud de su técnica, después de lo cual pasa a efectuar el 
experimento. En algún punto de su itinerario puede resultar evidente que la técnica que ha 
escogido adolece de un defecto grave. Es en este punto que el experimento se convierte en un 
estudio piloto, y sus datos sólo son útiles en la medida en que han puesto de manifiesto la 
insuficiencia técnica, aunque también pueden contener alguna indicación en cuanto a los medios a 
emplear para rectificar el fallo. Después de introducidos los cambios necesarios, el experimento 
sigue su curso, y el investigador se siente en todo momento optimista en cuanto a sus resultados, 
los cuales acecha atentamente dando por sentado que su procedimiento es técnicamente 
adecuado, y que su experimento le proporcionará una información válida. Dado que emplea toda 
la destreza y conocimientos de que dispone al emprender cualquier experimento, siempre espera 


finalizar la investigación con una conclusión satisfactoria. Esta investigación se convierte en un 
estudio piloto solamente cuando algún factor que había pasado desapercibido entra en escena, y 
pone de manifiesto un fallo técnico en el procedimiento. 


El siguiente procedimiento experimental descrito por Bloughf constituye un excelente ejemplo de 
lo que son los estadios iniciales en el diseño experimental, y lo describiré con considerable detalle, 
puesto que las soluciones a muchos de los problemas que se presentaron son de un notable 
interés práctico para el estudiante de técnicas experimentales. Para hacer justicia a Blough, sin 
embargo, debo resaltar que no se limitó a esperar a que surgiera cada problema antes de 
proyectar su solución. Este autor es un investigador competente e imaginativo y anticipó y resolvió 
muchos de los problemas descritos más abajo antes de empezar el experimento, aunque algunos 
de ellos no surgieron hasta que éste estaba muy avanzado, lo cual le forzó a clasificar su trabajo 
previo como estudio piloto. Sin embargo, con vistas a una mejor exposición será útil describir cada 
uno de los problemas como si todos pertenecieran a la segunda categoría, lo cual hubiera podido 
muy bien ser de haberse tratado de un investigador de menor talla. 


Blough estaba iniciando un programa de investigación sobre un proceso conductual conocido 
como “discriminación condicional”. Su primer paso consistió en diseñar un procedimiento por 
medio del cual pudiera generar y mantener un tipo de conducta apropiado. La adecuación de esta 
conducta debía estar sometida a una comprobación continuada de su utilidad y validez como línea 
de base a partir de la cual medir el grado de participación de las variables relevantes en el proceso 
de discriminación condicional. 


Omitiré los problemas que se plantearon al seleccionar los sujetos apropiados, construir los 
aparatos y establecer el procedimiento básico, y pasaremos directamente a la figura 22, que 
muestra una ilustración esquemática del sujeto y el aparato. 


lámparas para mee á 
los estimulos U comedero 
VISTA SUPERIOR VISTA LATERAL VISTA FRONTAL 


FIGURA 22. Ilustración esquemática del sujeto y el aparato utilizados en la investigación de Blough. 
La vida frontal muestra uno de los cuatro esquemas de estímulo posibles. (De Blough, 8.) 


La paloma (hambrienta) se halla situada ante un disco esconzado, formado por dos pulsadores 
semicirculares y traslúcidos, separados por una partición vertical de plástico, y sobre los cuales el 
animal puede picotear. El borde visible de esta partición constituye un tercer elemento de 


estimulación que denominará “barras”. Los dos pulsadores pueden  i¡iluminarse 
independientemente por medio de una lámpara de 6 vatios (derecha o izquierda) que se halla 
situada detrás de cada uno de ellos, mientras que la barra vertical puede iluminarse a su vez 
mediante una lámpara P. La partición, construida con un plástico transparente, permite el paso de 
la luz desde la lámpara P hasta la barra, pero sus lados son opacos a fin de restringir la luz de cada 
lámpara a su propia área de estimulación. La vista frontal muestra los pulsadores la barra tal como 
la ve la paloma representando uno de los varios esquemas de estimulación posibles. Sólo se 
ilumina un pulsador a la vez, y la barra puede estar iluminada u oscura. Es posible, pues, disponer 
los estímulos en cuatro modos distintos. 


Para que los reforzamientos resulten tan inmediatos y eficaces como sea posible, la tolva llena de 
grano se halla situada directamente debajo de los pulsadores, y puede ser colocada al alcance del 
sujeto mediante un electroimán. Mientras dura el reforzamiento, se ilumina una lámpara situada 
encima de la cabeza de la paloma, coincidiendo con la subida del grano que queda a disposición 
del animal durante unos dos segundos (8, página 335). 


La paloma puede obtener comida picando sobre el pulsador iluminado cuando la barra está 
oscura, picando sobre el pulsador oscuro cuando la barra está iluminada, por lo tanto, su conducta 
se halla bajo el control de los estímulos proporcionados tanto por la luz del pulsador como por la 
luz de la barra. Es necesario asegurarse de que el sujeto haga la discriminación solamente a partir 
de estos dos estímulos. Si otros factores guían la conducta del sujeto, la línea de base no medirá lo 
que el experimentador pretende que mida. De hecho, puede que en este caso el proceso no tenga 
nada que ver con la discriminación condicional. 


Supongamos, por ejemplo, que se empezó el experimento presentado las cuatro posibles 
combinaciones de estímulos en una secuencia fija. La paloma podía, pues, basar su discriminación 
en el orden en que los estímulos aparecían, más que en su configuración. Así, una secuencia fija 
podía ser, por ejemplo: 1) pulsador izquierdo oscuro, barra iluminada; 2) pulsador derecho oscuro, 
barra iluminada; 3) pulsador izquierdo iluminado, barra oscura; 4) pulsador derecho iluminado, 
barra oscura. En presencia de la pauta de estimulación 1), se reforzarían las respuestas al pulsador 
izquierdo. En la pauta 2), la posibilidad de reforzamiento se desplazaría al pulsador derecho. En 3), 
se volverían a reforzar las respuestas al pulsador izquierdo, y, finalmente, en 4), volvería a ser el 
pulsador derecho aquel que obtendría el reforzamiento. Así, pues, con cada presentación de 
estímulos el animal tendría que cambiar de pulsador. Esta alternación de respuestas indicaría una 
discriminación altamente desarrollada, pero podría resultar que la conducta no estuviera en 
absoluto bajo el control de los esquemas de las luces de barra y pulsadores. 


Si el experimentador cambiara la secuencia, de modo que las combinaciones de estímulos 
aparecieran en el orden 1), 3), 2), 4), podría muy bien encontrarse con que la paloma, en vez de 
llevar a cabo un ajuste condicional inmediato, continuara alternando sus respuestas de uno a otro 
pulsador. Al descubrir este error técnico, el experimentador se vería obligado a clasificar su 
experimento como estudio piloto, rectificar la situación, y proseguir desde este punto. 


Sin embargo, aun entonces podría ocurrir que la conducta de alteración resultará interesante por 
sí misma, con lo cual el investigador quizá decidiera posponer su objetivo inicial en beneficio de 
este nuevo camino. En tal caso, su labor original dejaría de constituir un estudio piloto, quedando 
integrado en el programa de investigación. 


Blough adaptó la solución comúnmente aceptada al problema de la alternación, presentando 
simplemente las cuatro disposiciones de estímulos en una secuencia mezclada, con lo que la 
conducta de alternación no podía resultar persistentemente reforzada. Sin embargo, pronto 
surgieron otros problemas, cuando reforzaba cada respuesta emitida sobre le pulsador correcto, la 
paloma quedaba saciada de comida muy pronto, debido a lo cual era imposible mantener la línea 
de base durante las cinco horas requeridas para unos estudios que había planeado sobre el efecto 
temporal de la acción de una droga. La dificultad se superó empleando un programa de 
reforzamiento bajo el cual sólo se podía obtener comida si picaba a una frecuencia no superior, de 
promedio, a una vez cada minuto y medio. Con esta técnica, las respuestas incorrectas nunca eran 
reforzadas, y las correctas sólo ocasionalmente obtenían comida. 


La administración del reforzamiento supuso introducir un nuevo problema. Se programó el 
mecanismo de modo que cada presentación del estímulo durara 15 segundos, con una separación 
entre dos presentaciones consecutivas de, también, 15 segundos de “intervalo oscuro”, durante el 
cual todas las luces de estimulación permanecían apagadas. Sin embargo, una vez que había 
recibido un reforzamiento, la paloma podía hacer caso omiso de las luces de estimulación en lo 
que le quedaba de los 15 segundos del período de presentación del estímulo, y continuar 
simplemente emitiendo la respuesta que había resultado ser la correcta en aquella ocasión. 
Bajo estas circunstancias la administración del reforzamiento, y no las luces de estimulación, se 
convirtió en el criterio de discriminación. De nuevo se había realizado una labor piloto. El error se 
rectificó eliminando el estímulo en cuanto se había administrado el reforzamiento, y, con el fin de 
impedir una discriminación temporal, se programó la administración del reforzamiento para que 
éste tuviera lugar en momentos distintos dentro del intervalo de presentación, como, por 
ejemplo, después de 1, 3, 6 ó 13 segundos del comienzo del estímulo. De este modo, se logró 
generar y mantener una tasa de respuesta constante a todo lo largo de la duración del estímulo. 


A pesar de todo el trabajo piloto que se necesitó para superar las dificultades técnicas 
mencionadas, quedaban varios problemas adicionales que retrasaron el inicio de la 
experimentación a gran escala. El siguiente problema se presentó cuando, después de una larga 
labor de experimentación, resultó imposible reducir el número de respuestas incorrectas a un 
nivel lo suficientemente bajo para corresponder a una discriminación bien establecida. El análisis 
que realizó Blough de este problema así como su solución, queda mejor descrito en sus propias 
palabras: 


Cuando se utilizan dos disco de respuesta, y la discriminación deseada requiere que solamente se responda 
sobre uno de ellos cada vez, ha el peligro de que se produzca un encadenamiento llamado “supersticioso” 
de las dos respuestas. Por ejemplo, puede suceder con frecuencia que el aparato se coloque en situación de 
reforzar una respuesta correcta en el instante preciso en que la paloma se halla picando sobre el pulsador 
incorrecto. En este caso, el primer picotazo sobre el pulsador correcto que siga a estas respuestas 


incorrectas, será reforzado, y en vez de aprender a emitir respuestas correctas, el sujeto puede aprender a 
emitir una o más de incorrectas, y luego, una de correcta. También puede suceder que tienda a obtener el 
reforzamiento alternando sus picotazos sobre los dos pulsadores, en lugar de picar sobre el pulsador 
correcto únicamente. Para eliminar estas posibilidades se establece que las respuestas incorrectas 
pospongan el reforzamiento. Así, cada respuesta incorrecta pone en marcha un temporizador, el cual impide 
que ninguna respuesta sea reforzada durante un segundo. Dado que entre cada respuestas incorrecta y un 
reforzamiento transcurre, al menos, un segundo, se reduce la tasa de emisión de estas respuestas, con lo 
que la conducta de alternación queda frustrada (8, página 336). 


De este modo se consiguió eliminar otra dificultad técnica, aunque a pesar de todo un informe de 
la investigación escrito en este estadio todavía hubiera clasificado el experimento de exploratorio. 
Sin embargo, aún quedaba un cierto número de problemas secundarios que se presentarían más 
tarde y deberían ser resueltos, y cual descripción puede hallarse en el informe de Blough. 
Dado que son, en cierta medida, demasiado complejos, no los describiré aquí. 


No todos los experimentos requieren una fase exploratoria tan extensa y difícil como la que acabo 
de describir, aunque también es cierto que en algunos de ellos las dificultades a resolver son 
todavía mayores. Desgraciadamente, es muy raro que las publicaciones técnicas describan este 
trabajo exploratorio. El estudiante puede estar seguro de que, en general, existe una gran 
cantidad de material que no se ha llegado a escribir, entre la introducción y el cuerpo principal de 
un informe experimental, aunque en ocasiones es posible leerlo entre líneas. Al describir un 
experimento sobre conducta de evitación, por ejemplo, el experimentador tal vez haya escrito que 
la palanca a la que respondían sus sujetos estaba conectada al circuito de shock. Un colega con 
experiencia inmediatamente reconocerá, sin más explicaciones, que el autor del informe se había 
enfrentado con el problema de los sujetos que se colgaban de la palanca, y que lo había 
solucionado colocando un electrodo de shock en aquélla. 


Un estudio piloto es, por tanto, aquél en el cual surgen problemas técnicos, el investigador debe 
estar seguro de que la conducta con la cual trabaja es adecuada a su experimentación, y la fase 
inicial de un diseño experimental tiene relación con este problema. Sin embargo, y contrariamente 
a la impresión popular, el experimentador no se dice a sí mismo: “Voy a emprender la Fase l, un 
estudio piloto. Si el experimento piloto funciona, pasaré a la ase ll, y haré el experimento como es 
debido”. En lugar de ello, monta su experimento, desde un buen principio, como si ya fuera la Fase 
Il, hasta que no se le presenta una dificultad imprevista da por sentado que su labor llegará a una 
conclusión satisfactoria. Sólo cuando aparece una dificultad clasifica el trabajo realizado hasta 
aquel momento como piloto. Si el investigador está de suerte es diestro, este punto surgirá 
bastante antes de haber consumido gran cantidad de tiempo y esfuerzo. A veces, sin embargo, un 
problema puede pasar desapercibido hasta el momento de redactar el informe “final”, o incluso 
después que éste haya sido publicado. En este caso, el experimento acabado se convierte en un 
estudio piloto, en un trabajo inconcluso. Así, pues, no hay un punto divisorio claro a partir del cual 
un experimento se convierte de estudio piloto en aportación substancial. 


Si se intenta comprobar una teoría débil, o demostrar un fenómeno conductual específico cuya 
existencia es muy dudosa, los estudios piloto se suelen dejar sin publicar. Su función es 


simplemente la de perfeccionar la técnica experimental, aunque se debe tener presente que si la 
técnica de que uno dispone tiene una utilidad general más allá de los objetivos concretos con que 
se lleva a cabo el experimento, una descripción de los estudios piloto puede resultar valiosa para 
otros investigadores. Si éstos pueden enterarse por adelantado de algunas de las dificultades son 
que es probable tropiecen, así como de sus soluciones, esto les ahorrará un considerable derroche 
de tiempo y trabajo. Además, otros investigadores pueden intentar emplear la técnica en cuestión 
sin darse cuenta tan sólo de todos los problemas que implica, por lo que la publicación de estudios 
piloto puede contribuir a elevar el nivel general de desarrollo científico en las áreas en que se 
emplean las técnicas descritas. Evidentemente, si la técnica en cuestión sólo es aplicable a un 
experimento concreto, es muy probable que la labor piloto realizada permanezca enterrada. 


En experimentos llevados a cabo con el único propósito de satisfacer la propia curiosidad, los 
estudios piloto pueden cumplir con otra función. Por ejemplo, una dificultad técnica imprevista 
puede dar lugar a una conducta que resulte de más interés que el que tenía la investigación para la 
cual se había montado originalmente el experimento, de modo que el experimentador quizá 
cambie de dirección y, en vez de eliminar la “dificultad” técnica, la explora más a fondo. En este 
caso, el experimento se convertirá en un estudio piloto incompleto con respecto al diseño original, 
pero constituirá, sin embargo, un sólido punto de arranque para la nueva investigación. Encuentro 
especialmente atrayente el siguiente ejemplo de cómo un estudio piloto puede transformarse en 
el impulsor de un nuevo programa de investigación. Este caso, no sólo imprimió una nueva y 
fecunda orientación en mi labor, sino que las investigaciones que se realizaron dentro de este 
nuevo enfoque me proporcionaron, en realidad, la clave para solucionar el problema original que 
había dado lugar al estudio piloto. 


La historia empieza, de hecho, en 1941, con una publicación de Estes y Skinner titulada “Algunas 
propiedades cuantitativas de la ansiedad”.??* En este artículo, los autores introdujeron su técnica 
de “supresión condicionada”. Los sujetos que emplearon, ratas blancas hambrientas, fueron 
entrenadas, en primer lugar, a apretar una palanca, con lo cual obtenían ocasionalmente un 
gránulo de comida. Después que la tasa de respuestas a la palanca hubo alcanzado un nivel 
relativamente estable, se introdujo una nueva operación. Mientras el animal estaba ganándose la 
comida, se presentaba un estímulo de cinco minutos de duración. En presencia de este estímulo el 
animal podía continuar apretando la palanca y recibir algún gránulo que otro, pero al final de los 
cinco minutos que duraba el estímulo mencionado se administraba un breve shock a los pies de la 
rata, a la vez que terminaba el estímulo. 


Durante el primer período de presentación del estímulo, la tasa de respuestas a la palanca del 
animal no sufrió ningún cambio. Sin embargo, después de algunos aparejamientos de estímulo- 
shock, la conducta en curso de apretar la palanca resultó profundamente alterada. La figura 5 
(en el capítulo 3) ilustra este efecto. El estímulo, después de haberse presentado varias veces 
aparejado con el shock, suprime completamente la conducta en curso reforzada con comida. 
La tasa de respuesta en presencia del estímulo desciende hasta alcanzar un valor próximo a cero, y 
una observación superficial puede comprobar que el animal se halla profundamente alterado. 


Durante los diez años siguientes, apenas se dedicó ningún esfuerzo a explorar más a fondo el 
fenómeno de supresión condicionada de un modo experimental. Brady, Hunt, y sus colaboradores 
resucitaron este procedimiento, utilizándolo para generar una línea de base conductual por medio 
de la cual estudiar la “terapéutica” de shock electro-convulsivo, lesiones cerebrales, fármacos, y 
otras operaciones fisiológicas.* debido, en gran parte, a que su uso como técnica para estudiar las 
relaciones entre la conducta otros fenómenos biológicos ha alcanzado gran difusión, la supresión 
condicionada ha empezado, en años recientes, a atraer la atención experimental y a considerarse 
como un fenómeno conductual intrínsecamente interesante. El estudio piloto que ahora voy a 
describir, junto con su consiguiente elaboración, constituyó uno de los atajos por los que se 
encaminó este resurgido interés experimental. 


La cuestión que nos impulsó a realizar este estudio piloto fue muy simple. ¿Continuaría 
produciéndose la supresión condicionada si empleáramos una conducta de evitación de shocks 
como línea de base, en lugar de una conducta reforzada con comida? ¿Qué ocurriría si 
introdujéramos el aparejamiento estímulo-shock mientras el animal estuviera ocupado en apretar 
la palanca que le servía para posponer el shock? Nuestra respuesta experimental a estas 
preguntas demostró que el sujeto, en el caso de un mono, no sólo no mostró ninguna supresión 
de su respuesta de apretar la palanca durante el estímulo previo al shock, sino que en realidad 
aumentó su tasa de respuesta.?* 


El procedimiento que utilizamos fue el siguiente: el mono recibía un breve shock cada vez que 
dejaba transcurrir 20 segundos son emitir ninguna respuesta a la palanca. Sin embargo, cada vez 
que la apretaba, el shock resultaba pospuesto 20 segundos. Así, apretando la palanca con la 
suficiente frecuencia, el animal podía evitar los coks totalmente. Este procedimiento generó una 
tasa de respuestas a la palanca relativamente constante a lo largo de un dilatado período de 
tiempo. Cuando la conducta de línea de base se estabilizó, se introdujeron los aparejamientos 
estímulo-shock. Se presentó un estímulo de cinco minutos de duración, al término del cual el 
animal recibía un shock inevitable. Estos estímulos se presentaban a intervalos regulares, con una 
separación de cinco minutos entre cada shock inevitable y el comienzo del estímulo siguiente. 
Mientras todo esto ocurría, el procedimiento de evitación se hallaba en vigor, de modo que, si en 
algún momento transcurrían 20 segundos sin ninguna respuesta a la palanca por parte del mono, 
tanto en presencia como en ausencia del estímulo, el animal recibía un shock. Tal como ya he 
indicado, este procedimiento tuvo como resultado un aumento en la tasa de respuestas en lugar 
de una supresión, durante el estímulo que precedía al shock. 


Cuando se interrumpió el procedimiento de evitación, el resultado fue todavía más sorprendente. 
Con esta modificación, los únicos shocks que el animal recibía eran los shocks inevitables 
administrados al término de cada presentación del estímulo, de modo que el shock dejaba de 
estar controlado por la conducta de apretar la palanca del animal. La figura 23 muestra el 
resultado típico, o sea, una tasa de respuesta casi nula en ausencia del estímulo y una acusada 
aceleración en presencia de éste hasta la administración del shock inevitable. El contraste con el 
descubrimiento de Estes y Skinner es sorprendente. La conclusión provisional que extrajimos de 
ello fue que una respuesta con una historia de condicionamiento de evitación manifestará una 


tasa aumentada, o facilitación, en lugar de una supresión, cuando es expuesta a la secuencia 
formada por un estímulo y un shock inevitable. Esta conclusión se vio grandemente fortalecida 
cuando descubrimos que el estímulo previo al shock facilitaba incluso una respuesta con comida 
después de haber conferido a esta respuesta una historia previa de condicionamiento de 
evitación.* 
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FIGURA 23. Curva acumulativa de respuestas mostrando una casi total ausencia de respuestas a la 
palanca cuando el estímulo de advertencia no está presente y una aceleración en la tasa de 
respuestas cuando lo está. La plumilla se mueve ligeramente hacia abajo al principio del estímulo, 
permaneciendo en esta posición desplazada hasta la administración del shock. El registro se ha 
dividido en dos segmentos de una hora cada una, superponiéndolos para ahorrar espacio y 
habiéndose marcado tanto el primer período como el séptimo con el número que les corresponde. 
(De Sidman, Herrnstein y Conrad, 78.) 


Llegamos ahora al punto más importante en relación con nuestra discusión sobre experimentos 
piloto. El siguiente paso que emprendimos fue determinar si podríamos establecer en un sujeto, 
simultáneamente, una supresión y una tasa aumentada durante el estímulo previo al shock. ?”* 
Si esto podía conseguirse, confiaríamos mucho más en nuestra capacidad de controlar las 
variables relevantes a los dos fenómenos opuestos. En primer lugar, condicionamos ambas 
respuestas simultáneamente. Apretando una palanca, el mono podía posponer el shock durante 
20 segundos, y apretando otra, podía conseguir reforzamiento con comida. La administración de 
comida se planteó de acuerdo con un programa de intervalo variable. Con ello, el animal poseía un 
repertorio experimental de dos respuestas concurrentes, una de ellas mantenida por 
reforzamientos con comida ocasional, y la otra por medio de una evitación de shocks. Ambas 


respuestas se emitían frecuentemente durante cada sesión experimental, registrándose por 
separado. 


¿Qué sucedería ahora al introducir el estímulo y el shock inevitable? Para que la situación resultara 
comparable a la que dio lugar a los datos ilustrados en la figura 23, retiramos de nuevo el shock 
del control del animal. De esta forma, los únicos shocks administrados fueron los shocks 
inevitables al término de cada presentación dl estímulo. ¿Observaríamos una supresión de la 


respuesta reforzada con comida, y, al mismo tiempo, un aumento en la tasa de respuesta que 
había tenido una historia de evitación? 


De hecho, lo que hallamos fue un aumento en la frecuencia de ambas respuestas durante el 
estímulo que precedía al shock. La figura 24 ilustra la perfecta identidad en la naturaleza de 
control ejercido por el estímulo sobre cada respuesta simultáneamente. Ambas respuestas 
mostraron una tasa casi nula durante los períodos entre estímulos, así como durante los primeros 
minutos inmediatamente anteriores a los shocks inevitables, ambas respuestas empezaban a 
emitirse a una tasa relativamente alta que se mantenía hasta la administración del shock. 
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FIGURA 24. Registros acumulativos concurrentes de las respuestas emitidas en cada una de las dos 
palancas. Cada desplazamiento hacia debajo de la plumilla indica el comienzo de una señal de 
advertencia. (De Sidman, 74.) 


Aparentemente habíamos fracasado en demostrar la adecuación de nuestra suposición original, 
dado que una respuesta reforzada con comida que no había tenido ninguna historia de evitación 


mostraba, a pesar de ello, una facilitación en lugar de una supresión, durante el estímulo previo al 
shock. 


Sin embargo, había un indicio que nos condujo a considerar la posibilidad de que nuestro intento 
de demostración había fracasado debido a una inadecuación técnica más que interpretativa. 
Resulta interesante el hecho de que este indicio nos fuera proporcionado por la avería de un 
aparato. En un instante dado, un transformador eléctrico del circuito de shock falló 
inesperadamente. Dado que esto impedía que se administrara ningún shock al sujeto, la tasa de 
respuestas a la palanca de evitación disminuyó gradualmente. Con gran sorpresa por nuestra 
parte, hubo una disminución correspondiente en la tasa de respuestas a la palanca de la comida. 
Los cambios que se produjeron en las dos respuestas estuvieron casi perfectamente sincronizados. 


Ahora bien, ¿por qué debería extinguirse la respuesta reforzada con comida, junto con la conducta 
de evitación, al desaparecer los shocks? El experimento se había montado con la intención de 
generar dos respuestas independientes, una con historia de evitación y la otra sin ella. Si este plan 
no había tenido éxito, la línea de base no resultaba adecuada para el propósito inmediato y el 
experimento tendría que clasificarse de exploratorio, al menos con relación al problema para el 
que se había diseñado. 


Nuestra tarea, pues, se convirtió en determinar su habíamos llevado a cabo un experimento 
definitivo, o si en realidad sólo se trataba de un estudio piloto. ¿Acaso había algo más que una 
historia de evitación implicada en la tasa de respuesta aumentada durante el estímulo que 
precedía al shock? ¿O había, quizás, algún factor que no hubiéramos tomado en consideración en 
nuestro experimento sobre dos respuestas simultáneas? 


En términos experimentales, la cuestión se planteó del modo siguiente: ¿Era la respuesta 
reforzada con comida realmente independiente de las contingencias de evitación? O, por el 
contrario, ¿estaba siendo mantenida, al menos en parte, por el reforzamiento negativo 
proporcionado por la evitación de shocks? Resultó necesario llevar a cabo otro experimento a fin 
de determinar si esta posibilidad era realmente cierta. Mientras tanto, tuvimos que dejar en 
suspenso nuestra decisión acerca de si el experimento original sobre dos respuestas era, o no, 
piloto. 


Las nuevas manipulaciones que se llevaron a cabo eran sencillas, y no incluían la combinación de 
estímulo y shock inevitable. Simplemente, volvimos a la situación en la que una respuesta era 
mantenida por reforzamiento con comida, y la otra, simultáneamente, por la evitación de shock. 
A partir de aquí, intentamos extinguir la respuesta reforzada con comida desconectando el 
mecanismo que la suministraba. El intento fracasó, puesto que la respuesta con una historia de 
reforzamiento con comida persistía mientras se mantuvieran las contingencias de evitación que 
controlaban a la otra, y no fue posible demostrar que las dos respuestas fueran independientes. 
Por lo tanto, nuestro experimento original sobre dos respuestas no había llegado a establecer una 
línea de base apropiada para comprobar la importancia de la historia conductual como factor 
determinante de los efectos del estímulo anterior al shock. A pesar de que habíamos conferido 
explícitamente una historia de evitación a sólo una respuesta, nuestro procedimiento también 
había otorgado, de algún modo desconocido, un componente de evitación a la respuesta 


reforzada con comida. Era, pues, a todas luces evidente, que nuestro experimento constituía un 
estudio piloto. 


De ello se pueden aprender dos cosas. Una de ellas es que calidad de piloto de un experimento no 
tiene por qué ser evidente de inmediato, pudiéndose requerir una experimentación adicional 
antes de poder emitir un juicio adecuado. La otra, es la misma consideración con que se empezó 
este examen, y su importancia se deriva del rumbo que tomó nuestro programa experimental 
después que se hubo demostrado la no-independencia de las dos respuestas. Esta no- 
independencia parecía constituir un fenómeno digno de explorarse por interés propio. De este 
modo, se desvió la atención experimental de paradigma de Estes-Skinner hacia una investigación 
de los factores implicados en la articulación de las dos respuestas. Se llevó a cabo una serie de 
experimentos en los cuales las dos respuestas se condicionaron y extinguieron por separado, o 
bien se extinguieron simultáneamente y se volvieron a condicionar independientemente una de la 
otra. A continuación, se sustituyó la respuesta de apretar la palanca por otra consistente en tirar 
de una cadena, y se adoptaron nuevos tipos de medición para investigar las secuencias en que se 
producían las dos respuestas. Así, se pudo averiguar con qué frecuencia una respuesta a la cadena 
iba seguida de una respuesta a la palanca, con qué frecuencia ésta iba seguida a su vez por otra 
respuesta a la cadena, etcétera. Para mantener la emisión de respuestas a la cadena se emplearon 
programas de reforzamiento distintos al de intervalo variable. 


Una consecuencia de este nuevo programa fue el esclarecimiento de los factores responsables de 
la no-independencia de conductas mantenidas concurrentemente. Con respecto a este programa, 
el experimento inicial sobre dos respuestas no podía considerarse de ningún modo un estudio 
piloto, ya que a pesar de no haberse diseñado para estudiar la articulación de respuestas, resultó 
útil con vistas a la resolución de este problema. 


Sin embargo, resultó de más importancia para nuestro propósito actual el hecho de que el nuevo 
programa de investigación nos diera la clave para solucionar nuestro problema original. Mientras 
estudiábamos la interdependencia de respuestas, descubrimos un conjunto de factores mediante 
los cuales podíamos conservar relativamente independientes las respuestas concurrentes de 
evitación reforzadas con comida. Permítaseme ahora completas el cuadro describiendo 
simplemente el experimento resultante, sin entrar en los pormenores de todos los procesos que 
nos condujeron a él. Al igual que se hizo en el experimento original, fue la respuesta a la palanca 
aquélla a la que se confirió una historia de evitación. La otra respuesta, o sea, la emitida a la 
cadena, se reforzó bajo un programa de razón fija de 15:1, es decir, que se requerían 15 
respuestas a la cadena por cada reforzamiento. En este momento se volvió a introducir la 
secuencia formada por el estímulo el shock inevitable. Los resultados de esta operación pueden 
verse en la figura 25, donde observamos que esta vez hubo, en presencia del estímulo, una 
facilitación de la respuesta de evitación y supresión de la respuesta a la cadena reforzada con 
comida. 


Nuestras investigaciones sobre la no-independencia de respuestas había dado lugar a una técnica 
(cuyo punto crítico era el programa de reforzamiento de razón fija) para acentuar la 


independencia entre dos respuestas mantenidas concurrentemente. La aplicación de esta técnica 
hizo posible generar una línea de base apropiada al problema original, consiguiéndose colocar 
bajo control experimental uno de los factores críticos responsables de la conducta emitida en 
presencia del estímulo que precedía al shock. Por lo tanto, con respecto a su propósito original, el 
primer experimento de la serie constituyó un estudio piloto negativo, al mismo tiempo que su 
inconsistencia técnica nos impidió sacar ninguna conclusión válida acerca de los factores causantes 
de la supresión o facilitación de la conducta emitida en presencia del estímulo que precedía al 
shock. En lo que toca al problema de la independencia entre respuestas, sin embargo, el primer 
experimento constituyó una aportación positiva, de modo que, cuando este hallazgo positivo fue 
explorado por su interés intrínseco, se descubrió un medio para rectificar el fallo técnico original, 
transformándose, consiguientemente, de estudio piloto negativo en experimento definitivo. 
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FIGURA 25. Registros acumulativos concurrentes de las respuestas emitidas en la cadena y la 
palanca respectivamente. Los segmentos desplazados hacia debajo de los registros corresponden 
a los períodos en que estaba presente un estímulo de advertencia. Las líneas de trazos indican la 


coincidencia en el tiempo de puntos situados en los registros, correspondientes a la presentación 
del estímulo. (De Sidman, 74.) 


El estudio piloto no es, por lo tanto, un paso previo ineludible en el diseño experimental, sino que, 
por el contrario, resulta ser una consecuencia imprevista de la experimentación que se está 
llevando a cabo sin un conocimiento de las variables importantes. Si los estudios piloto tienen 
lugar con tanta frecuencia, ello es debido a la gran cantidad de factores insuficientemente 


comprendidos, tanto aisladamente como combinados, que hay implicados en la mayor parte de 
las investigaciones conductuales. Sn embargo, también se debe a nuestro relativo estado de 
ignorancia el hecho de que se pueda sacar, con mucha frecuencia, un gran provecho de los 
estudios piloto. El experimentador que esté dispuesto a dejarse llevar por los datos que obtenga, y 
aceptar el desafío que plantean las nuevas variables a medida que van surgiendo, puede 
aprovecharse considerablemente de los estudios piloto. Sin embargo, sólo será capaz de hacerlo si 
lleva a cabo todos sus experimentos bajo condiciones tales que puedan llegar a ser definitivos de 
no surgir algún problema inesperado. Un experimento piloto deliberado, en el cual el 
experimentador rehúsa a propósito mantener las más rigurosas condiciones, nunca podrá 
trascender más allá de su pobre realidad. 


VIII. Estados estables 


La decisión de estudiar la conducta en estado estable y no en estados de transición, o viceversa, 
puede influir profundamente en el diseño de un experimento concreto. Podemos, por el 
momento, definir un estado estable, o uniforme, como aquél en que la conducta en cuestión 
mantiene invariables sus características a lo largo de un intervalo de tiempo determinado. 
Decimos que la conducta atraviesa por un estado de transición al cambiar de un estado estable a 
otro. Por consiguiente, un estado estable otro de transición no se hallan completamente 
separados, y, para identificar el principio y el fin de un estado de transición, debemos conocer algo 
acerca de las propiedades de los estados estables que lo limitan. 


Se han desarrollado, fundamentalmente, dos tipos de interés experimental por la conducta en 
estado estable. Uno de ellos puede denominarse “descriptivo” y el otro “manipulativo”. En el 
estudio puramente descriptivo se mantiene un conjunto de condiciones experimentales a lo largo 
de un amplio período de tiempo, lo que permite llevar a cabo una observación de los aspectos, 
tanto estables como transitorios, de la conducta resultante. Este modo de investigar es 
fundamental para el desarrollo de técnicas de control de la conducta y de línea de base a partir de 
las cuales medir los cambios conductuales. El diseño de los experimentos sobre estado estable 
puramente descriptivos contrasta vivamente con el plan tradicional de investigación en psicología. 


Los estudios descriptivos de la conducta en estado estable se planifican según un diseño simple. Se 
introduce n procedimiento fijo en los aparatos automáticos de control, se coloca el sujeto en su 
ambiente experimental, y se da vuelta a un conmutador para poner en marcha el experimento. 
A partir de este instante, y hasta que llega el momento de evaluar los datos recogidos, el 
investigador no hace más que observar, centrando su atención en los instrumentos de registro y 
en los sujetos. Tal vez añada nuevos mecanismos de registro a medida que el experimento avanza, 
con objeto de obtener una descripción más completa del proceso conductual que ha 
desencadenado, pero no lleva a cabo en ningún momento una nueva manipulación de las 
condiciones experimentales. Por lo tanto, el investigador sólo pone en práctica se destreza 
creadora, su conocimiento de las sutilezas conductuales y su habilidad de manipulación en la 
selección original de las variables que debe introducir en la programación de los aparatos de 
control. Una vez que ha dado comienzo el procedimiento, todas las sutilezas y manipulaciones 
aparecen en la conducta del sujeto, no en la del experimentador. 


Los datos proporcionados por un experimento de este tipo no ponen en relación algún aspecto de 
la conducta con distintos valores de una variable independiente manipulada. Por el contrario, las 
curvas resultantes ilustran los cambios que se producen. En función del tiempo, en la conducta 
emitida bajo la situación experimental. El interés se centra principalmente, pues, en las 
características temporales de la conducta mantenida por un conjunto invariable de factores. 
Gracias a experimentos de este tipo hemos aprendido, por ejemplo, las propiedades que muestra 
a largo plazo la conducta mantenida por distintos programas de reforzamiento. El experimentador 
introduce el programa deseado en los aparatos de control y no lo altera hasta que considera que 
puede dar una descripción fiable de la conducta que genera el programa en cuestión. 


Un ejemplo interesante, de entre los muchos que se podrían seleccionar, es el programa de 
reforzamiento mixto de intervalo fijo y de razón fija (34, páginas 620-629). En este procedimiento, 
el aparato establece, inmediatamente después de cada reforzamiento, o bien un programa de 
razón fija o bien de intervalo fijo, sin seguir un orden determinado. No hay ningún estímulo que 
indique al sujeto bajo cuál de los dos programas se halla en un momento dado. Por lo tanto el 
sujeto debe, o bien emitir un número de respuestas fijo, o bien dejar transcurrir un período de 
tiempo, también fijo, para que pueda obtener el siguiente reforzamiento, sin que se le presente 
ninguna indicación exterior sobre cuál de las dos alternativas es la apropiada en un momento 
dado. Después de varias horas de exposición al programa mixto, una paloma produce, 
establemente, un registro del tipo ilustrado en la figura 26. Una alta tasa de respuesta, 
característica de la conducta controlada por un programa de razón fija, sigue a cada 
reforzamiento. (En el registro acumulativo, los reforzamientos se indican mediante cortos trazos 
oblicuos.) Si en un momento dado se halla en vigor un programa de razón fija, la paloma obtiene 
un reforzamiento cuando ha emitido el número de respuestas requerido, que en este caso era de 
27. Si dicho reforzamiento no le llega después de haber emitido un número de respuestas 
aproximadamente igual al requerido por la razón, la alta tasa cesa abruptamente y aparece un 
“codo”, característico de la conducta de intervalo fijo. La “cuenta” de la razón fija sirve de 
estímulo, producido por la misma conducta, que informa al sujeto bajo cuál de los dos programas 


se halla. 


FIGURA 26. El registro acumulativo muestra una actuación muy perfecta de una paloma bajo un 
programa de reforzamiento mixto con componentes de razón fija e intervalo fijo. Los cortos 
desplazamientos oblicuos indican los reforzamientos. (De Ferster y Skinner, 34, p. 622.) 


La conducta generada por el programa mixto es muy compleja, pero sigue una estricta 
regularidad. Es el resultado de un conjunto de factores especificado con precisión, que, cuando se 
mantienen constantes a lo largo de un período de tiempo considerable, dan lugar, a la larga, a una 
pauta conductual estable. Los datos de la figura 26 constituyen una sólida aportación al análisis de 
la conducta. Sin embargo, dado que este diseño experimental no requiere la manipulación de 
ninguna variable una vez que el programa ha sido puesto en marcha, alguien podría negarse a 
considerar los datos de la figura 26 como el fruto de un experimento. Por el contrario, preferiría 
calificarlos de demostración. La figura 26 es, evidentemente, una demostración, puesto que pone 


de manifiesto la existencia de un complejo esquema temporal de conducta en un sujeto individual, 
que cualquier investigador que observe las precauciones normales del control experimental puede 
reproducir. La relación entre la conducta y el programa de reforzamiento que la controla es lo 
suficientemente precisa y sólida como para exigir su inclusión en cualquier descripción o teoría 
exhaustiva de la conducta. Es cierto que estos datos plantean nuevas cuestiones cuyas respuestas 
requerirán la manipulación de otras variables, pero ésta es precisamente la marca distintiva de un 
experimento excepcionalmente creador. No existe ningún libro de texto sobre diseño de 
experimentos conductuales que incluya esta técnica tan considerablemente fecunda: la simple 
descripción de las propiedades conductuales tal como se manifiestan por sí solas a lo largo de un 
gran intervalo de tiempo y bajo un conjunto constante de factores. 


Los psicólogos experimentales están acostumbrados, al diseñar sus experimentos, a asegurarse 
observaciones de control en cada uno de ellos, y con frecuencia emplean las mismas 
observaciones de control, una y otra vez, para distintas operaciones experimentales. Sin embargo, 
el experimento sobre un programa mixto que se ilustra en la figura 26, no parece proporcionar las 
observaciones de control acostumbradas, y ello constituye, tal vez, otra razón de la mala 
disposición para clasificarlo como experimento. Por ejemplo, alguien podría desear ver una 
comparación con la conducta generada por el programa de razón fija solo, y, de un modo 
parecido, por el programa de intervalo fijo solo. ¿Son realmente los breves períodos de altas tasas 
de respuestas que siguen a cada reforzamiento una consecuencia del componente de razón en 
programa mixto, o también tendrían lugar si el intervalo fijo se programara solo, sin ninguna 
complicación adicional? Tal vez la comparación deseable nos la proporcionaría un programa 
múltiple (ver capítulo 11), que sólo se diferencia del mixto en la presentación de un estímulo 
exteroceptivo que “indica” al sujeto bajo qué programa se halla. Con un estímulo externo para 
indicar el programa en vigor, podemos preguntarnos si la paloma todavía mostraría una conducta 
de razón después de cada reforzamiento, en cuyo caso el programa mixto no nos indicaría nada 
nuevo. 


Tales observaciones de control no se omitieron por casualidad. Los experimentos que sirven para 
poner de manifiesto y describir regularidades en la conducta emitida bajo un conjunto constante 
de factores que la controla, no tienen por qué dejarse a un lado como porciones aisladas de una 
labor de investigación más general. Gran parte de la importancia de los datos de la figura 26, por 
ejemplo, provienen de una comparación con otros experimentos en los que se han investigado, de 
un modo similar, los programas de razón fija, intervalo fijo, y otros, por separado y en varios tipos 
de combinación. Las observaciones se han llevado a cabo en experimentos independientes, pero 
es posible usar tales observaciones de control, independientemente obtenidas, sin necesidad de 
repetirlas en cada experimento, aunque sólo en áreas en las cuales se haya alcanzado un alto 
grado de control experimental y una gran facilidad de replicación. En estas áreas, los experimentos 
pueden diseñarse de modo que utilicen la información que se ha establecido sólidamente en 
investigaciones previas. 


Esta investigación descriptiva de la conducta en estado estable debe preceder a cualquier estudio 
manipulativo. La manipulación de nuevas variables dará lugar a menudo a cambios conductuales, 


pero a fin de describirlos deberemos ser capaces de especificar la línea de base a partir de la cual 
se observan estos cambios. De no ser así, toparemos con problemas insolubles de control, 
medición y generalidad. 


El problema del control es básico, y aunque ya lo discutí anteriormente en relación con la 
variabilidad, resulta procedente aquí tratarlo con mayor amplitud. Cuando un diseño experimental 
requiere la manipulación de alguna variable independiente, una línea de base de estado estable, 
anterior a la operación experimental, nos indicará si es probable que otras variables extrañas 
jueguen un papel importante en la obtención de los resultados de nuestro experimento. Así, si 
antes de empezar con la fase manipulativa del experimento mantenemos la conducta en un 
estado estable de características conocidas, podemos atribuir cualquier desviación persistente de 
la conducta estable típica, a las variables imprevistas que se han introducido en el experimento. 
Por otra parte, las desviaciones ocasionales que se observen de la conducta estable típica nos 
obligarán a refinar nuestras técnicas antes de que podamos introducir las operaciones 
experimentales. Sin embargo, a menos que la conducta en estado estable se haya investigado 
descriptivamente de antemano, no podremos juzgar si aquella conducta es típica o se halla, por el 
contrario, contaminada por factores extraños. 


Como aplicación general de la conducta en estado estable investigada de un modo descriptivo, 
puedo citar el programa de reforzamiento de intervalo fijo como técnica para descubrir un control 
experimental inapropiado. Se recordará que el programa de intervalo fijo pone el reforzamiento a 
disposición del animal sólo después de que haya transcurrido en período de tiempo fijo desde un 
pinto bien definido, como podría ser, por ejemplo, un reforzamiento previo. Un ejemplo de la 
conducta típica generada por un programa de intervalo fijo se muestra en la figura 18 (ver páginas 
172-173). Los reforzamiento van seguidos, de un modo inmediato, por un período sin respuestas, 
y a continuación suele observarse un aumento gradual en la curva de respuestas, hasta que se 
administra el reforzamiento siguiente. Sin embargo, la curvatura de este registro acumulativo es 
típica en un sentido restringido solamente, puesto que algunos investigadores que han trabajado 
con un programa de intervalo fijo no han visto nunca esta pronunciada curvatura en sus datos. La 
experiencia ha demostrado que el grado de curvatura de los registros de intervalo fijo constituye 
un indicador sensible del grado de control experimental alcanzado, particularmente cuando se 
emplean intervalos de 10 a 15 minutos o más. 


En condiciones bien controladas, es posible mantener, por ejemplo, una conducta de intervalo fijo 
de 10 minutos de un modo estable, en la que el sujeto emplee más de cinco minutos (50 por 
ciento del intervalo) en emitir el primer 25 por ciento de las respuestas totales de cada intervalo. 


pe 


Esta medida se ha denominado el “cuarto de vida”.** Si la curva fuera lineal, el primer 25 por 
ciento de las respuestas se emitiría en el primer cuarto del intervalo, y el cuarto de vida, en 
nuestro ejemplo, sería 2,5 minutos. En el caso de que la curva estuviera negativamente acelerada, 
el cuarto de vida sería menor que este intervalo, mientras que con una curvatura positiva 


sobrepasa los 2,5 minutos. 


Los estudios descriptivos de la conducta de intervalo fijo en estado estable han demostrado que 
un cuarto de vida menor del 50 por ciento en un intervalo fijo largo refleja un control deficiente de 
ciertas variables, tales como deprivación, tipo de reforzamiento empleado, magnitud del mismo, 
etcétera. Estas variables son comunes a un gran número de procedimientos experimentales, y su 
control adecuado es un asunto de interés general. Constituye, por lo tanto, una práctica cada vez 
más extendida entre los investigadores comprobar, antes de dar comienzo a un programa 
experimental, la adecuación de sus variables de reforzamiento, en un programa de intervalo fijo 
de 10 ó 15 minutos. Cuando consiguen mantener una conducta de intervalo fijo de 10 minutos con 
un cuarto de vida mayor de 5 minutos, junto con una alta tasa terminal, pueden pasar a manipular 
variables de mayor interés en contextos constituidos por procedimientos distintos del de intervalo 
fijo, con la confianza de que sus variables de reforzamiento se hallan bajo un control apropiado a 
la mayoría de propósitos. En general, cuanto mayor sea la deprivación, mayor deberá ser la 
magnitud del reforzamiento, y cuanto más apropiada sea la comida utilizada para reforzar al 
animal, con mayor probabilidad se logrará un control completo de la situación experimental. 


La conducta en estado estable también proporciona un índice del rigor de control experimental 
alcanzado en situaciones más restringidas. En el ejemplo precedente se utilizó una conducta de 
intervalo fijo en estado estable para verificar el grado de control alcanzado sobre ciertas variables 
que son comunes a un elevado número de procedimientos distintos. La verificación del control 
logrado sobre la curvatura de intervalo fijo resultaría todavía más directamente significativa si el 
experimento propuesto fuera de naturaleza tal que implicara la manipulación de las variables 
específicas a un contexto conductual de intervalo fijo. Supongamos, por ejemplo, que deseamos 
investigar los efectos de un fármaco sobre la conducta mantenida por un programa de 
reforzamiento de intervalo fijo. Si no establecemos, en primer lugar, una línea de base cuyo grado 
de curvatura nos asegure que se ha obtenido un control riguroso, es probable que los efectos 
atribuidos a la acción del fármaco resulten de una variabilidad desconcertante. El investigador 
chapucero atribuirá esta variabilidad a factores inherentes a la droga o la conducta, cuando el 
error se encuentra, de hecho, en su omisión de la información descriptiva fundamental. 


Esto mismo resulta cierto en otros tipos de procedimiento distintos del de intervalo fijo. Así, por 
ejemplo, sin un conocimiento descriptivo adecuado previo de la conducta de evitación, un 
investigador puede encontrarse manipulando variables indefinidamente, en experimentos de 
evitación de estado estable, pero nunca sabrá si sus datos son el resultado de su manipulación o 
bien si se deben a una combinación de factores que está investigando. 


La obtención de una línea de base de estado estable, antes de introducir cualquier manipulación 
experimental, también posibilita una medición relativamente exacta de los cambios conductuales, 
permitiendo evaluar los efectos de las variables manipuladas con referencia a la propia conducta 
del sujeto. El experimento psicológico clásico utiliza, como medición de los cambios en la 
conducta, la diferencia entre un grupo que ha sido expuesto a la variable experimental y un grupo 
de control intacto. Una virtud inmediata del estado estable en substitución del grupo de control. 
Consiste en la eliminación de la variabilidad entre sujetos, con lo cual se aumenta gradualmente la 
sensibilidad de las mediciones conductuales. Las variables que, al comparar grupos, podrían ser 


desechadas por tener poco o ningún efecto, pueden demostrar ser extremadamente poderosas 
cuando se evalúan con referencia a una línea de base individual estable. La variabilidad entre 
sujetos no es una característica de los procesos conductuales que tienen lugar en el organismo 
individual, y cuando esta variabilidad es incluida en las mediciones de los procesos individuales 
supuestos, el poder conclusivo de las medidas resulta inevitablemente sacrificado. 


Cuanto más riguroso sea el control experimental y más precisa y sensible la técnica de medición 
empleada, mayor será la generalidad de los hallazgos experimentales, y en la medida en que las 
líneas de base conductuales de estado estable pueden contribuir, en este sentido, a aumentar la 
generalidad, deberían ser incorporadas a diseño experimental siempre que ellos fuera posible. 
En lo que queda de capítulo, expongo varios ejemplos de manipulación de estados estables en 
investigaciones conductuales, con lo que espero hacer resaltar la utilidad de este modo de diseñar 
experimentos. 


REVERSIBILIDAD 


Si manipulamos la conducta de un sujeto haciéndola cambiar de un estado estable a otro, es 
importante saber si se producen cambios irreversibles que imposibiliten restituir la conducta a un 
estado anterior. Supongamos, por ejemplo, que deseamos investigar los efectos ejercidos por 
cierto número de dosis de un determinado fármaco, sobre una conducta de apretar la palanca 
mantenida por un programa de reforzamiento de intervalo variable. Dicho en otras palabras, 
deseamos obtener una curva de respuestas en función de las dosis. El primer paso consistiría en 
exponer el sujeto al programa de intervalo variable, sin el fármaco, hasta que se obtuviera una 
tasa estable de respuestas. En este momento administraríamos la primera dosis de fármaco, que 
llamaremos Dosis |. Supongamos que la tasa de respuesta aumenta después de la administración 
de dichas Dosis l, 


Ya tenemos pues, ahora, dos puntos de la curva mencionada, puesto que conocemos la tasa de 
respuesta en ausencia del fármaco, y la correspondiente a la Dosis l. Surge ahora un problema con 
respecto a la Dosis Il, daño que desconocemos si la administración inicial del fármaco ha alterado 
la tasa de respuesta de modo que resulte imposible recobrar la conducta de línea de base original 
de intervalo variable. Si éste es el caso, no serpa legítimo añadir el tercer punto a nuestra curva, 
dado que la respuesta a la segunda dosis de fármaco reflejaría, además, la influencia de la Dosis l. 
así, el tercer valor de la curva y probablemente también los subsiguientes, reflejarían, además, la 
influencia de la primera dosis, es necesario, por lo tanto, averiguar si puede recuperarse la tasa de 
respuesta original después de cada administración de la droga, y no podrían darse al sujeto dosis 
adicionales hasta que se hubiera logrado reproducir la tasa adicional con un margen de 
variabilidad aceptable. El diseño experimental implicará pues, determinaciones alternativas de los 
efectos de la droga así como la recuperación de la conducta de estado estable. Este mismo diseño 
es, evidentemente, aplicable a otras variables distintas de la administración de fármacos. 


Hay otros métodos para evaluar la reversibilidad, pero antes de describirlos debe señalarse que el 
hecho de que un proceso demuestre ser irreversible no invalida, necesariamente, los datos 
obtenidos individual. Las relaciones funcionales obtenidas en el estudio de procesos irreversibles, 
también pueden proporcionar una información útil, a pesar de que requieran alguna validación 
adicional. El tipo de validación más satisfactorio será aquél que consista en una explicación de la 
falta de reversibilidad. 


Boren, por ejemplo, estudió en un experimento la tasa de respuestas e un programa de 
reforzamiento de razón fija en función de la magnitud de la razón requerida.** Este autor observó 
que, a medida que aumentaba la razón de respuestas por reforzamiento, siguiendo una serie 
creciente, la tasa de respuesta aumentaba a su vez de un modo regular hasta alcanzar un valor 
límite. Una vez se hubo llegado a la tasa máxima, Boren redujo la razón, y observó que no podía 
reproducir cuantitativamente, en algunos de sus sujetos, la función que había obtenido en la serie 
creciente original. Se hallaba, pues, ante un caso claro de irreversibilidad parcial (ver la figura 28). 


Tanto Boren como otros experimentadores, sin embargo, habían llevado a cabo con anterioridad 
observaciones sobre la tasa de respuesta en experimentos que incluían razones fijas altas. 
Se dieron cuenta de que, a medida que aumentaba la razón, la topografía de la respuesta del 
animal cambiaba marcadamente. Una rata, por ejemplo, suele permanecer de pie sobre el suelo 
del recinto experimental y apretar la palanca con sus extremidades anteriores cuando el programa 
de reforzamiento de razón fija bajo el cual se halla tiene una razón baja. A una tasa más alta, el 
animal suele apoyarse en la pared del recino, manteniendo sus patas delanteras a la altura de la 
palanca, eliminando así la necesidad de incorporarse hasta ella y soportar todo su propio peso 
sobre sus patas traseras. Al aumentar todavía más la razón, la rata agarra la palanca con sus 
dientes, y la hace vibrar a una tasa próxima al valor máximo posible. Entonces, al reducir de nuevo 
la razón, persisten algunas de estas formas de conducta, debido a lo cual no se recuperan las tasas 
bajas observadas originalmente. 


A la luz de estas observaciones suplementarias, el hallazgo de que la tasa de respuesta aumenta al 
crecer progresivamente la razón fija de un programa, no resulta invalidado por una falta de 
reversibilidad. Sin embargo, lo que se requiere es una descripción concomitante de otros aspectos 
de la conducta, además de su tasa de emisión, puesto que una descripción adicional ayuda a 
explicar el aumento sufrido por la tasa y al mismo tiempo revela la fuente de irreversibilidad. 


El estudiante puede preguntarse si no se podría haber rectificado esta situación simplemente 
alterando el orden en que se habían programado las razones en un principio, en lugar de utilizar 
una serie creciente. Con un poco de experiencia, sin embargo, se daría inmediata cuenta de que 
este diseño no lograría evitar el problema. En primer lugar, un salto demasiado grande en la 
magnitud de la razón haría desaparecer la conducta en vez de aumentar su tasa, dado que es 
necesario aproximarse a las razones altas de un modo gradual para que la conducta se mantenga. 
En segundo lugar, aun si estos saltos no fueran demasiado grandes, la topografía de la conducta 
cambiaría igualmente al aumentar la razón y al programar una razón fija subsiguiente más 
pequeña que la anterior, los efectos del cambio en la topografía se reflejaría en la tasa de 


respuesta. Continuaríamos, por lo tanto, topando con la irreversibilidad. Además, los datos 
obtenidos sobre la tasa probablemente resultarían caóticos, dado que los efectos de los cambios 
topográficos se distribuirán de un modo desigual por toda la función que relaciona la magnitud de 
la razón con la tasa. La curva resultaría una mezcla, casi imposible de descifrar, de las funciones 
ascendentes y descendentes halladas por Boren. Aumentar la razón gradualmente era, pues, el 
púnico método de obtener la relación ordenada que Boren halló. 


Podemos preguntarnos si estas restricciones impuestas a la interpretación de los hallazgos 
experimentales disminuyen su generalidad. La relación hallada por Boren entre la tasa de 
respuesta y la magnitud de la razón solamente puede observarse cuanto ésta aumenta 
gradualmente. No se obtendrá esta relación funcional ni mezclando el orden de las variaciones a 
que es sometida la razón, ni aumentándola a saltos más grandes. Por otra parte, tampoco 
podremos reproducir la función haciendo decrecer la razón desde un valor alto. A la vista de estos 
inconvenientes, ¿posee la función alguna generalidad o, por el contrario, carece totalmente de 
significación? 


La respuesta a esta pregunta se inclina a favor de la generalidad. Al identificar con más precisión 
las condiciones bajo las cuales tiene lugar un fenómeno, aumentamos automáticamente su 
generalidad, dado que n existe ninguna correlación entre dos variables de un modo totalmente 
aislado e independiente de otros factores. Mientras otros factores que influyen en una relación 
funcional permanezcan en la oscuridad, seremos incapaces de describir con certeza las 
condiciones bajo las cuales se cumple esta relación. La ignorancia sobre qué variables son 
relevantes y cuáles no, hace que la generalidad del descubrimiento sea engañosa, y aunque 
probablemente le otorguemos una importancia general, no justificada por los hechos, su 
reproductibilidad se verá grandemente reducida. Todo factor adicional que descubramos que 
influye en el proceso, restringirá todavía más nuestra interpretación del mismo. Puede observarse 
que una relación funcional dada sólo se cumple, por ejemplo, cuando se utiliza un programa de 
reforzamiento determinado, cuando el nivel de deprivación de comida del sujeto oscila entre 24 y 
48 horas, la temperatura no sobrepasa los 33 grados centígrados, la variables independiente se 
manipula a lo largo de un intervalo creciente, el sujeto ha tenido una historia de condicionamiento 
de evitación, etcétera. Sin embargo, cuando se conozcan estas importantes restricciones 
podremos reproducir la función a voluntad, y mientras controlemos los factores conocidos y 
críticos, se cumplirá la función ante todas las variaciones posibles en las condiciones que 
acompañan al fenómeno. 


Esta facultad de reproducción de un proceso, basada en un conocimiento sólido, es la 
característica definitoria básica de la generalidad, que no se deberá confundir con la simple 
fiabilidad. Un fenómeno puede ser reproducible, y por lo tanto fiable, en ausencia de un 
conocimiento preciso de las principales variables que lo determinan, y es posible mantener los 
factores constantes sin saber exactamente cuáles de entre ellos son necesarios para que dicho 
fenómeno sea reproducible. Sin embargo, cuando se pueden especificar las condiciones que lo 
hacen reproducible, a su fiabilidad se añade también la generalidad. 


Schoenfeld y Cummning, que se hallaron ante un caso de irreversibilidad, o “inelasticidad”, similar 
al de Boren, resumieron sus implicaciones sobre el diseño experimental con notable precisión: 


Funciones conductuales como las presentes, obtenidas en organismos individuales, sirviendo cada uno de 
ellos como su propio control y habiendo alcanzado un equilibrio de respuesta o “estado estable” bajo 
valores sucesivos y sistemáticamente cambiantes de una variable independiente experimental, no resultan, 
evidentemente, invalidadas por ningún tipo de “inelasticidad”. Sin embargo, este fenómeno impone una 
condición adicional a la interpretación de tales funciones y, además, conlleva varias implicaciones para el 
diseño de experimentos conductuales, como por ejemplo, el que en casos como el presente resulte 
deseable evitar la administración de los valores de la variable independiente siguiendo un orden aleatorio, 
utilizando, en cambio, la exploración sistemática de la función continua a fin de evitar la contaminación del 
efecto primario de la variable con cualquier tipo de irreversibilidad. Aparte de estas consideraciones, toda 
“inelasticidad” demostrable en una función conductual posee tanta importancia por sí misma como la 
propia función (66, página 352). 


EVALUACIÓN DE LA REVERSIBILIDAD 


La reversibilidad puede evaluarse utilizando métodos distintos al de la replicación directa; por 
ejemplo, mediante la replicación sistemática. Para citar un caso, esto sucede cuando, en vez de 
replicar una función con un mismo sujeto, se someten sujetos distintos a los mismos valores de 
una variable experimental, aunque siguiendo un orden distinto. Si la relación funcional es la misma 
en todos los casos, puede concluirse, sin temor a equivocarse, que el orden de aplicación no tiene 
ningún efecto especial. Un ejemplo que ilustra tanto esta técnica como una variante más refinada 
de la misma, puede encontrarse en un experimento que publiqué hace varios años.” 


Este experimento versaba sobre la conducta de evitación de shocks, utilizando tres ratas como 
sujetos, e investigaba dos variables principales. La primera de ellas era el intervalo shock-shock, 
que se define como el tiempo que transcurre entre shocks sucesivos en el caso de que el animal 
no emita ninguna respuesta de evitación. Dicho en otras palabras, en ausencia de respuestas de 
evitación los shocks se administraban al sujeto con un una frecuencia especificada por el intervalo 
shock-shock. Sin embargo, cada vez que la respuesta de evitación (apretar una palanca) tenía 
lugar, se posponía el próximo shock. Cada respuesta de evitación retrasaba la administración del 
shock durante un período de tiempo determinado. El intervalo de tiempo que una respuesta 
posponía el shock, es decir, el intervalo respuesta-shock, era la otra variable manipulada. De este 
modo, se obtuvieron las curvas que relacionaban la tasa de respuestas de evitación con cada una 
de las variables independientes. 


El diseño general del experimento fue como sigue: manteniendo el intervalo shock-shock 
constante para un animal dado, se medía la tasa de evitación de respuestas en estado estable 
correspondiente a varios intervalos distintos de respuesta-shock. La secuencia en que se 
programaron los intervalos respuesta-shock fue diferente para cada uno de los tres sujetos. Así, 


por ejemplo, el Sujeto +41 fue expuesto a intervalos respuesta-shock de 20. 15, 30, 10, 50, 7, 4, 90 y 
150 segundos en este mismo orden. La serie que se siguió para el Sujeto +t2 fue la siguiente: 10, 
30, 15, 50, 7, 90, 20, 4, 150 y 2,5 segundos. Finalmente, se utilizó una tercera secuencia para el 
Sujeto +H3. 


Después que hubo terminado la primera serie de intervalos respuesta-shock, se programó un 
nuevo intervalo shock-shock, y se investigó de nuevo una secuencia de intervalos respuesta-shock. 
El orden de exposición a estos intervalos también fue distinto para los tres animales. 
Las secuencias eran a la vez distintas de las tres primeras que se habían empleado. Se siguió, 
luego, este procedimiento varias veces más para cada animal. En total, se llevaron a cabo 14 
replicaciones de la función que relacionaba a tasa de respuestas de evitación con el intervalo 
respuesta-shock, acompañándose cada replicación de una secuencia distinta de intervalos 
respuesta-shock. 


No sólo varió la secuencia de intervalos respuesta-shock entre los tres animales para cada valor 
del intervalo shock-shock, sino que el orden de exposición a los diferentes valores de este 
intervalo fue también distinto. Con el Sujeto +1, por ejemplo, la primera serie de intervalos 
respuesta-shock fue acompañada de un intervalo shock-shock de 10 segundos, y las secuencias 
subsiguientes de respuesta-shock se aplicaron junto a valores del intervalo shock-shock de 30, 5, 
2,5, y 15 segundos, en este orden. El orden de exposición a los intervalos shock-shock fue, para el 
Sujeto +2, 5, 20, 10, 2,5 y 50 y cero segundos. Todavía se utilizó otra secuencia distinta para el 
Sujeto $ 3. 
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FIGURA 27. Representación del logaritmo de la tasa de respuesta en función del logaritmo del 
intervalo respuesta-shock para cada uno de los tres animales. Las cifras situadas a la izquierda de 
cada curva indican los intervalos shock-shock. Para facilitar la comparación, las curvas se han 


desplazado en un valor en el sentido positivo de las ordenadas. El logaritmo del valor del 
desplazamiento viene indicado por los números situados a la derecha. (De Sidman, 70.) 


Cada una de las 14 funciones obtenidas de este modo constituyó una replicación sistemática, dado 
que el orden de exposición a las variables críticas fue distinto en cada caso. Parte de los datos 
resultantes puede verse en la figura 27, donde el logaritmo de la tasa de respuestas de evitación 
está representado en función del logaritmo del intervalo respuesta-shock. Los valores del intervalo 
shock-shock se indican en el extremo izquierdo de cada curva. Observamos que las funciones 
toman la misma forma para todos los animales, a pesar de que tanto los intervalos respuesta- 
shock, como shock-shock, se programaron siguiendo una secuencia distinta en cada caso. El orden 
de presentación no fue, por lo tanto, decisivo, y los procesos implicados son, aparentemente, 
reversibles. 


La replicación de la forma de la función con un animal dado fue sistemática en vez de directa, y en 
lugar de replicar la función exactamente bajo las mismas condiciones, se cambió el valor de una de 
las variables principales, el intervalo shock-shock, en cada replicación. Del mismo modo, la 
secuencia de intervalos respuesta-shock fue distinta en cada replicación. La posibilidad de repetir 
la relación funcional en un único sujeto, utilizando secuencias de intervalos respuesta-shock e 
intervalos shock-shock distintas, nos proporciona una confirmación adicional de la reversibilidad 
del fenómeno. 


Este experimento ilustra, por lo tanto, dos variantes de replicación sistemática como método para 
evaluar la reversibilidad. Una de ellas solamente implicó la utilización de un único sujeto, con 
distintas secuencias de manipulación de una variable (intervalo respuesta-shock), para cada valor 
dado sucesivamente a una segunda variable (intervalo shock-shock). La otra, implicó la utilización 
de sujetos adicionales, con una manipulación, en distintos órdenes, de ambas variables 
independientes. La consistencia de los datos obtenidos ante estas variaciones, indica que los 
procesos conductuales en cuestión son verdaderamente reversibles, y, además de demostrar 
dicha reversibilidad, permite también cobrar un dividendo, común a todos los tipos de replicación 
sistemática, en forma de datos adicionales. De esta forma, pudimos examinar, por ejemplo, las 
relaciones entre la tasa de respuestas de evitación y el intervalo shock-shock, para cada uno de los 
diversos valores del intervalo respuesta-shock, y también fue posible realizar análisis más 
detallados. La replicación directa de las funciones hubiera sido un procedimiento mucho menos 
económico. 


Los experimentos en que se manipulan estados estables, suelen requerir un período de tiempo 
relativamente largo para llevarse a cabo, dado que el proceso de cambiar de un estado a otro es 
con frecuencia prolongado, y el propio estado estable debe ser observado durante un intervalo 
bastante largo a fin de determinar si realmente se ha alcanzado la estabilidad. La irreversibilidad 
puede surgir, en estos experimentos a largo plazo, de procesos que requieren un período dilatado 
de tiempo antes de que puedan llegar a ejercer un efecto apreciable. Cuando se sospecha la 
existencia de un proceso de este tipo, suele ser posible llevar a cabo una comprobación muy 


simple. Un ejemplo de ello se encuentra en el experimento cuyos datos se hallan representados en 
la figura 3 (ver capítulo 3). Los puntos de estas curvas se obtuvieron siguiendo un orden 
consecutivo de izquierda a derecha. Un descenso relativamente repentino en la tasa de respuesta 
tiene lugar en un valor bajo del porcentaje de shocks, al cual se expusieron los animales hacia el 
final del experimento. La variable independiente manipulada fue de naturaleza tal, que hubiera 
podido sospecharse que aquel descenso brusco era resultado de un proceso de extinción a largo 
plazo, en vez de estar en función de un determinado valor de la variable independiente. 
Ello implicaba que, aun en el caso de que el porcentaje de shock se hubiera mantenido a un valor 
de, por ejemplo, el 50 por ciento a todo lo largo del experimento, la súbita disminución observada 
en la tasa habría tenido lugar en este estadio temporal particular. Si éste hubiera sido el caso, el 
proceso hubiera resultado entonces irreversible. 


Esta posibilidad se comprobó simplemente volviendo a colocar los sujetos bajo el porcentaje de 
shocks al cual habían estado expuestos inmediatamente antes de que descendiera la tasa. 
Al mostrar ésta el mismo valor anterior, se descartó la existencia de un proceso a largo plazo que 
determinara dicho descenso. Cuando esta replicación de “punto único” tuvo éxito no fue 
necesario llevar a cabo la replicación de puntos adicionales de la curva. 


La reversibilidad puede evaluarse, pues, en ocasiones, mediante la comprobación de un único 
punto, en lugar de utilizar un tipo de replicación más amplio. Puede aumentarse, por lo tanto, la 
economía del diseño experimental si el experimentador tiene en cuenta esta posibilidad. 


Cuando se observa que los efectos debidos al orden en que se administran las variables impiden la 
reversibilidad, dichos efectos no pueden ignorarse, tal como Schoenfeld y Cumming señalaron, * 
ni tampoco eliminarse. Los cambios irreversibles en la conducta ocasionados por una exposición 
previa del organismo a alguna variable, no pueden aceptarse, simplemente, tal como se presenta 
sin llevar a cabo un análisis más profundo. El orden de presentación de las variables no es, en sí 
mismo, una variable básica; cada vez que la secuencia resulta decisiva en sus efectos, debe 
analizarse el caso en cuestión en términos de los procesos conductuales generados por dicha 
secuencia. Estos efectos no serán los mismos en cada caso. Así, por ejemplo, valores distintos de 
una razón fija pueden producir topografías de respuesta diferentes, mientras que distintos valores 
de un programa de intervalo variable pueden dar lugar a un reforzamiento accidental de tasas 
altas. También es probable que algunas magnitudes del intervalo respuesta-shock den lugar a una 
conducta de dilación apreciable, y así podríamos ir citando casos. Estos procesos conductuales 
tienen interés e importancia por sí mismos, y su investigación resultará con frecuencia más 
provechosa que el estudio continuado de una función que dichos procesos convierten en 
irreversible. 


Se abandonará la realización de cualquier diseño experimental preconcebido tan pronto como se 
observen efectos conductuales debidos al orden de administración de variables, que sugieran 
nuevos caminos de exploración. Una desviación de este tipo no es necesariamente irrelevante 
respecto al diseño original, dado que la relación funcional que interesaba en un principio 


requerirá, para su completa descripción, un estudio de los procesos causantes de su 
irreversibilidad. 


La irreversibilidad puede y debe explicarse en cualquier descripción o teoría de la conducta. 
Contrariamente a algunas nociones generalmente admitidas sobre diseño experimental, la 
irreversibilidad no puede eliminarse mediante la “compensación” de los factores experimentales. 
Un prototipo de diseño compensado se ilustra en la Tabla 1. En este experimento hay dos valores 
de una variable independiente, denominados “Factor A” y “Factor B”. En la primera fase del 
experimento, se somete al Sujeto +t1, al Factor A, y en la segunda fase, al Factor B. se somete al 
Sujeto +42 al mismo procedimiento pero en orden inverso, de modo que el Factor B se aplica en la 
Fase l, y el Factor A en la Fase ll. 


TABLA 1 


Un ejemplo de diseño compensado 


FASE 1 FASE UU FASE 111 
Sujeto ++ 1 Factor Á Factor B Factor A 
Sujeto H 2 Factor B Factor A Factor B 


e 5 y. 


Supongamos que la medición conductual en este experimento es la latencia de respuesta, y se 
observa que para el Sujeto +t1, el Factor B produce una latencia más corta, mientras que el Sujeto 
42 muestra una latencia más corta en presencia del Factor A. A continuación se observa que este 
fenómeno se mantiene en las replicaciones efectuadas con otros sujetos, por lo que resulta 
evidente que la latencia es una función, no sólo de los dos factores experimentales simplemente, 
sino también del orden en que los sujetos son sometidos a ellos. 


Después de demostrarse, mediante controles adicionales, que la latencia no cambia meramente 
en función del tiempo, se añade la Fase ll al experimento, de modo que cada sujeto es sometido 
de nuevo a la misma situación en que se hallaba en la Fase l. se observa que las latencias de 
respuesta de ambos sujetos permanecen cortas, y no recuperan el nivel que mostraban en la 
Fase |. El fenómeno, pues, parece irreversible. 


¿Qué debe hacer el investigador para resolver su problema original, consistente en determinar la 
relación entre la latencia y los dos factores experimentales, independientemente de su orden de 
presentación? La variable “orden de presentación” se ha considerado, por lo general, un estorbo 
metodológico que debe dejarse a un lado siempre que ello sea posible. Nuestro investigador 
hipotético vuelve a su experimento original, constituido por dos fases, que precisamente se diseñó 
para hacer frente a una eventualidad de este tipo. Gracias al particular diseño de este 
experimento, podrá sacarse un bonito truco de la manga: promediando los datos obtenidos con 
ambos sujetos bajo el Factor A, y haciendo lo mismo para el Factor B, “compensa” el efecto 
ejercido por el orden de presentación de los factores, y soslaya completamente el problema de la 
irreversibilidad, sin ni siquiera tocarlo. Así, mediante una simple operación aritmética, los dos 
sujetos se han convertido en uno, y, a la vez, se ha eliminado una variable. 


Este modo de actuar recuerda al de un ilusionista que hace desaparecer un conejo dentro de un 
sombrero. Todos los espectadores, excepto, quizás, los niños, saben que el conejo todavía está en 
alguna parte, pero se preguntan a dónde ha ido a parar y cómo lo ha conseguido el ilusionista. 
En nuestro caso, el ilusionista ha hecho desaparecer los números que describen la conducta, pero 
todos sabemos que ésta realmente se produjo, y nos preguntamos a dónde ha ido a parar. 


De hecho, no ha ido a parar a ninguna parte. Los números pueden hacerse desaparecer, 
simplemente, sumándolos y restándolos entre sí. Así, por ejemplo, cinco manzanas menos tres 
manzanas son dos manzanas, y aunque los números pueden cambiarse fácilmente con unos pocos 
plumazos, deberemos comernos las manzanas para que desaparezcan de verdad. En nuestro 
ejemplo, la única operación análoga a comerse las manzanas sería la eliminación del efecto 
ejercido por el orden de presentación de variables mediante una manipulación experimental 
adecuada. Esto sólo puede lograrse identificando los procesos responsables del efecto irreversible 
ejercido por el orden de presentación, así como sometiendo dichos procesos a control 
experimental. La variable “orden de presentación” no queda eliminada con el promedio, dado que 
éste contiene los efectos de ambas variables. 


Supongamos que la latencia promedio para el Factor A resulte mayor que la encontrada para el 
Factor B. la conclusión sería que, con los efectos de orden de presentación compensados, el Factor 
A produce latencias más largas que el Factor B. este hallazgo podría ser real si las latencias 
correspondientes al Factor A en cada fase separada del experimento fueran mayores que las 
latencias correspondientes al Factor B. Sin embargo, también podría haber sucedido que el Factor 
A hubiese producido una latencia mucho mayor que la producida por el Factor B en la Fase l, y una 
latencia sólo ligeramente menor que el Factor B en la Fase ll. O bien, que las latencias hubieran 
sido iguales en la Fase | mientras que el Factor B hubiera producido una latencia mucho menor 
que el Factor A en la Fase ll. Por lo tanto, es evidente que hubieran podido obtenerse promedios 
similares a partir de efectos cuantitativamente distintos del orden de presentación. En realidad, la 
generalización de los efectos relativos ejercidos por los Factores A y B no sería independiente de 
su orden de aplicación, y dichos efectos debidos al orden estarían presentes en los números 
obtenidos, aunque permanecieran escondidos a la vista. 


Underwood, que discute el método de diseño basado en la compensación mutua, con bastante 
detalle, pone de relieve que “La compensación mutua no elimina los efectos [de orden de 
presentación]; sólo distribuye estos... efectos por igual entre todos los factores cuando los efectos 
se consideran para todos los sujetos combinados” (91, página 325). En armonía con nuestra propia 
discusión, también señala que “Si el experimentador no tiene ninguna razón para creer que el 
efecto de ir de A a B es totalmente distinto de ir de B a A, no debería utilizar este método, dado 
que con él obtendría una idea falseada de las influencias de los factores experimentales como 
tales” (91, página 326). 


Todavía podemos ir más lejos, afirmando que a menos que la variabilidad entre sujetos haya sido 
reducida hasta un valor despreciable, se observarán inevitablemente grandes diferencias 
individuales en los efectos debidos a las secuencias A-a-B y B-a-A. Es decir, que no sólo puede 


diferir el efecto de ir de A a B, del de ir de B a A, sino que es probable también que esta diferencia 
varíe de un sujeto a otro en dirección y magnitud al mismo tiempo. Dar por sentada que las 
diferencias se deben a los efectos de la variabilidad incontrolada, y que por lo tanto se 
compensarán mediante su promediación, además de absurdo sería peligroso. Con el grado de 
variabilidad entre sujetos normalmente tolerado en los experimentos conductuales, lo más 
razonable es suponer que los distintos órdenes de aplicación, A-a-B y B-a-A, realmente dan lugar a 
efectos distintos de un sujeto a otro, y que se debe desconfiar del diseño que utiliza el método de 
compensación mutuo. 


No existe de hecho ningún diseño experimental que pueda anular la verdadera irreversibilidad, y 
este objetivo no puede conseguirse ni por medio del control estadístico ni tampoco del control 
experimental. Si el cambio de un valor a otro de una variable experimental genera un proceso 
conductual que impide volver más adelante al estado conductual original, debemos incluir este 
proceso en nuestras descripciones de la conducta en cuestión. Si esto significa que una relación 
funcional simple no nos servirá para abarcar los resultados de nuestro experimento, así debe 
aceptarse. La conducta, de igual modo que cualquier otro objeto de estudio, no puede forzarse 
para que quepa dentro de un esquema descriptivo simple sólo por el hecho de que nosotros, 
como científicos, hayamos descubierto que las leyes simples son preferibles a las complejas. Un 
esquema descriptivo no puede ser más simple que el objeto de estudio que abarca, y el 
investigador debe, por lo tanto, estar preparado para tratar con la irreversibilidad siempre que la 
encuentre. 


Actualmente casi no se dispone de datos que describan procesos conductuales irreversibles. 
Los diseños experimentales que se requerirían para este tipo de descripción parecen fastidiosos a 
los investigadores, y tal vez sea ésta la razón de que haya esta laguna. Sin embargo, un diseño 
experimental sólo resulta fastidioso cuando los datos potenciales que con él se obtendrían son de 
poco interés para el investigador. Permítasenos, por lo tanto, describir sumariamente algunos 
diseños experimentales con el doble fin de llamar la atención del estudiante hacia ellos, y 
mostrarle a la vez cuán interesantes pueden ser estos datos potenciales. 


Supongamos que seleccionamos, como primer ejemplo, el experimento de Boren al que ya me he 
referido. Se recordará que este experimento trataba sobre la conducta mantenida por un 
programa de reforzamiento de razón fija. Boren manipuló la magnitud de la razón fija, o sea, el 
número de respuestas requeridas por reforzamiento y midió la tasa de respuestas resultante en 
función del tamaño de la razón. Empezó con una razón baja que gradualmente fue aumentando, 
siguiendo, por lo tanto, una serie ascendente. La curva de trazo continuo de la figura 28 muestra el 
nivel de conducta en estado estable de un animal para cada valor de la razón fija. 


La fase siguiente del diseño de Boren constituyó el primer paso hacia una descripción de la 
irreversibilidad. Boren intentó replicar la función en el mismo animal, empezando con la tasa más 
alta y volviendo hacia atrás, siguiendo un orden descendente, hasta la más baja, los resultados que 
obtuvo aparecen en la línea de trazos. Observamos, pues, que no se logró la replicación. 
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FIGURA 28. La curva representa la relación de la tasa de respuesta del animal con el número de 
respuestas requerido por cada reforzamiento. Los puntos situados sobre el trazo continuo se 
obtuvieron en un intervalo creciente de la razón, mientras que los situados sobre la línea de trazos 
se obtuvieron en un intervalo decreciente de la misma. (Curvas obtenidas de datos de Boren, 11.) 


La investigación se detuvo en este punto, ya que el problema de la irreversibilidad no era del 
interés de Boren en aquel momento, y una descripción más completa de la irreversibilidad de la 
función hubiera requerido varios estadios adicionales de investigación. Probablemente se hubiera 
tenido que someter de nuevo a los animales a la serie ascendente de magnitudes de la razón, y, 
después, a la serie decreciente. Quizás hubiera sido necesario llevar a cabo más repeticiones. 


Esto pudiera parecer un conjunto de manipulaciones fastidioso y aburrido. Sin embargo, los datos 
nuevos e interesantes no tienen por qué proceder solamente de diseños experimentales 
diferentes y creadores. En el caso que nos ocupa, los datos resultantes hubiesen sido los primeros 
en su especie, y tendríamos una idea del proceso de irreversibilidad en sí mismo, tal como se 
desarrolló y quizás tal como desapareció. ¿Qué aspecto hubiese tenido este cuadro? La variedad 
de posibilidades y la incertidumbre de la predicción confieren a estos datos potenciales gran parte 
de su naturaleza fascinante. 


Así, por ejemplo, ignoramos si la segunda serie creciente replicaría la primera serie decreciente. 
O bien, por el contrario, mostraría también irreversibilidad, ¿Obtendríamos una familia de curvas 
que aumentarían sucesivamente en su valor de la ordenada, hasta que la función alcanzara 
finalmente la estabilidad? ¿Se centrarían tal vez todas las curvas alrededor de la misma tasa 
máxima, o quizás dicha tasa máxima cambiaría a su vez de un modo sistemático? Tarde temprano, 
los propios factores causantes de la irreversibilidad alcanzarían un punto límite, a partir del cual 
las replicaciones subsiguientes empezarían a mostrar reversibilidad. ¿Cuál sería este punto? 
¿Continuaría la función estable siendo creciente o bien, por el contrario, tomaría alguna otra 
forma? 


Datos de esta naturaleza abrirían un área totalmente nueva de investigación conductual. El diseño 
experimental es simple, aplicable a una gran variedad de situaciones y procedimientos. 
Sin embargo, aunque los datos serían complejos, también serían limpios, susceptibles de ser 
evaluados del mismo modo que cualquier otro de los que ya he descrito, y la irreversibilidad se 
mostrará tal como es, es decir, como un fenómeno conductual capaz y digno de ser estudiado, y 
no como algo que deba ocultarse en el armario trasero. 


Un segundo diseño experimental apto para evaluar la irreversibilidad puede hallarse en el 
contexto de algunos datos obtenidos por Findley.*” Es realidad, Findley daba un enfoque distinto al 
problema que acabamos de discutir, de la tasa de respuesta en función de la magnitud de la razón. 
(Diré más cosas sobre este enfoque en el capítulo 11). Este experimentador intentó evitar el 
problema de irreversibilidad con que se encontró Boren. Lo que hizo fue correlacionar cada 
magnitud de la razón con un estímulo distinto, presentando toda la serie de magnitudes de razón 
a lo largo de cada período experimental aislado. El procedimiento fue el siguiente: 


Utilizando un mono como sujeto, Findley programó cinco tamaños de razón distintos, el menor de 
los cuales requerían 33 respuestas por reforzamiento. La sesión experimental se dividió en ciclos 
de dos horas de duración cada uno, y la primera media hora de cada ciclo se subdividió a su vez en 
períodos de seis minutos. El animal podía obtener un único reforzamiento durante cada uno de 
estos períodos de seis minutos. Durante el primero de estos períodos, se presentó al animal el 
estímulo +1, y se le administró un único reforzamiento cuando hubo emitido 33 respuestas. 
Dentro del siguiente período de seis minutos, en presencia del estímulo +42, tuvo que emitir 66 
respuestas para obtener el reforzamiento. En cada período sucesivo de seis minutos, el estímulo 
cambiaba, y se doblaba el número de respuestas requerido para obtener el reforzamiento 
correspondiente. Inmediatamente después del quinto período se apagaron todas las luces de 
estimulación hasta terminar el ciclo de dos horas, finalizado el cual dio comienzo un nuevo ciclo 
con la presentación del estímulo +t1. 
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FIGURA 29. Registro de la conducta de apretar la palanca de un mono bajo un programa de 
reforzamiento de razón fija, en el cual la razón de respuestas a reforzamientos se doblaba después 
de cada reforzamiento. (Datos amablemente cedidos por Findley, 35.) 


En la figura 29 puede verse un registro de la conducta en estado estable que resultó de este 
procedimiento. La figura empieza con un grupo de 33 respuestas, que produce un reforzamiento. 
Sólo se producen unas pocas respuestas adicionales hasta que aparece el estimulo +2, momento 
en que la plumilla del registrador vuelve a colocarse en el punto de partida. A continuación tiene 
lugar un grupo de 66 respuestas antes de que se administre el reforzamiento siguiente. El registro 
continúa de este modo hasta alcanzar el grupo final de 528 respuestas. El resto del ciclo de dos 
horas no está representado en la figura. 


Usando esta técnica, Findley replicó la forma de la función original hallada por Boren. La tasa de 
respuesta aumentaba a la vez que el tamaño de la razón. El problema de la reversibilidad, sin 
embargo, no es el mismo aquí que en el experimento de Boren, y no hay duda de que la función es 
recuperable, ya que, de hecho, se recupera varias veces en cada sesión experimental. Cuando se 
alcance el estado estable, el sujeto habrá experimentado cada magnitud de la razón un gran 
número de veces. Esencialmente, Findley estaba trabajando dentro del estadio que Boren hubiera 
alcanzado de haber continuado repitiendo sus series crecientes hasta que los procesos que 
generaban la irreversibilidad hubiese llegado a su límite. El problema, en el caso de Findley, puede 
expresarse como sigue. ¿Habría obtenido la misma función de haber aplicado la razón más elevada 
en el primer período de seis minutos, disminuyéndola en una mitad en cada uno de los períodos 
siguientes? Ignoramos si la función original hubiera resultado recuperable si las razones se 
hubieran programado siguiendo un orden decreciente en lugar de ascendente. 


De momento se desconoce la respuesta a esta cuestión. Sin embargo, supongamos, para proseguir 
con nuestro ejemplo, que la función no fuera replicable si las razones se presentaran en el orden 
inverso. Según las concepciones clásicas del diseño experimental en psicología, se consideraría que 
los datos de Findley poseen sólo una generalidad limitada. La solución comúnmente aceptada 
sería la de adoptar un diseño experimental diferente, en el que la secuencia de razones variara de 
un ciclo a otro. En un diseño como éste, se argúiría, que no habría efectos de secuencia, y que los 
datos poseerían la máxima generalidad posible. 


Sin embargo, si se presentaran efectos debidos al orden de aplicación, el hecho de alterar el orden 
de la secuencia de un ciclo a otro constituiría un procedimiento muy poco deseable. Los efectos de 
secuencias distintas continuarían reflejándose en los datos, sólo que ahora resultarían 
irremisiblemente confundidos entre sí, y, por lo tanto, su evaluación sería imposible. 


Únicamente la manipulación deliberada y sistemática de las secuencias proporcionará una 
solución adecuada al problema. El diseño experimental que se necesita en este caso requiere que 
la conducta sea colocada en estado estable bajo un cierto número de posibles secuencias de 
presentación de las magnitudes de la razón. Así, por ejemplo, se deberían hacer comparaciones 
entre las funciones obtenidas con las secuencias crecientes y con las decrecientes, con secuencias 
en que la magnitud de la razón aumente primero y disminuya después, etc. De este modo, se 
podrán realizar descripciones precisas de los efectos ejercidos por el orden de aplicación de las 
razones y los factores que impiden la reversibilidad podrán ser explicados e incluidos entre los 


factores determinantes de la función que relaciona la tasa de respuestas con la magnitud de la 
razón. 


Podemos ver de nuevo que el diseño experimental adecuado en un caso que implica 
irreversibilidad no es, necesariamente, el más simple. Tal vez cuando sepamos más acerca de la 
irreversibilidad en general, podremos disponer de diseños experimentales simples. Sin embargo, 
hasta que llegue este momento no disponemos de ningún atajo. 


IX. Estados estables (continuación) 


EL CRITERIO DE ESTABILIDAD 


En los experimentos que implican la manipulación de estados estables, ¿cómo decide el 
experimentador si la conducta que estudia se ha estabilizado? ¿cómo se puede identificar un 
estado estable? Permitaseme señalar de antemano que, independientemente del criterio de 
estabilidad que uno pueda utilizar, no existe una respuesta final definitiva. La utilidad de los datos 
no dependerá de si se ha conseguido una estabilidad final, sino de la fiabilidad y validez del criterio 
empleado. Es decir, ¿sirve realmente el criterio de estabilidad para seleccionar un estado de 
conducta reproducible y generalizable? Si la respuesta a esta pregunta es afirmativa, la 
manipulación experimental de estados estables, definidos por el criterio de estabilidad, 
proporcionará datos ordenados y generalizables a otras situaciones. Si, por el contrario, el criterio 
de estabilidad es inadecuado, los fracasos al intentar reproducir y replicar sistemáticamente los 
hallazgos experimentales lo pondrán de manifiesto. 


¿Cómo se selecciona, pues, un criterio de estabilidad? De nuevo, no tenemos ninguna regla a 
seguir, dado que el criterio dependerá del fenómeno investigado y del nivel de control 
experimental que pueda mantenerse. En este caso, los estudios descriptivos, a largo plazo, de la 
conducta en estado estable resultan extraordinariamente útiles, observando la conducta a lo largo 
de un período de tiempo dilatado, y manteniendo constantes los factores experimentales, es 
posible llegar a una estimación del grado de estabilidad que, eventualmente, puede mantenerse. 
Es posible seleccionar, entonces, un criterio a partir de estas observaciones. 


Ya he descrito, con bastante detalle, un estado en el que la tasa de respuestas de evitación era 
manipulada, haciéndola pasar de un estado estable a otro, por medio de variaciones 
experimentales en los intervalos shock-shock y respuesta-shock (ver capítulo 8, páginas 238-241). 
En el experimento citado, el criterio de estabilidad se derivaba de anteriores estudios descriptivos 
de conducta de evitación, bajo valores que eran mantenidos constantes en ambos parámetros 
temporales. Como resultado de estos estudios descriptivos de larga duración, pareció factible una 
generalización sobre el estado estable, puesto que cuando la tasa de respuestas alcanzaba un 
determinado nivel de estabilidad, no era probable que sufriera más cambios de tipo sistemático. 
Este nivel se eligió, pues, como criterio de estabilidad. Una determinada combinación de los 
intervalos shock-shock y respuesta-shock, se aplicaba persistentemente hasta que la tasa de 
respuesta cumplía con el criterio de estabilidad prefijado. Este criterio requería, antes de poder 
cambiar de un programa de shock a otro, que la diferencia entre las tasas obtenidas en dos de 
cada tres períodos experimentales consecutivos cualquiera, no fuera mayor de 0,1 respuestas por 
minuto. 


La regularidad de los datos resultantes sirvió para confirmar que el criterio elegido en aquella 
situación experimental particular era adecuado. Se produjeron, sin embargo, unas pocas 
desviaciones apreciables en las funciones obtenidas y es probable que se debieran a que el criterio 


de estabilidad no era lo suficientemente riguroso. Puede tolerarse un pequeño grado de este tipo 
de variabilidad, si los demás datos son suficientemente numerosos y sólidos, de modo que 
aparezca con claridad que los puntos desviados no reflejan la existencia de una variable 
fundamental desconocida. 


Posteriores investigaciones más completas sobre conducta de evitación dieron lugar a una 
objeción más seria al criterio de estabilidad empleado en aquel caso. Se vio claro que, bajo ciertas 
condiciones, el criterio no representaba un estado estable válido. Así, por ejemplo, cuando se 
utilizan monos en lugar de ratas como sujetos experimentales, el alargamiento del intervalo 
respuesta-shock solamente produce una disminución muy lenta y tardía en la tasa de respuestas 
de evitación. El criterio de una diferencia no mayor que 0,1 respuestas por minuto en dos de cada 
tres sesiones consecutivas, se cumple muchas veces en el lento proceso de cambio de una tasa de 
respuestas alta a otra baja, y cada vez que ello sucede el criterio determina una tasa de respuestas 
progresivamente menor. 


Los hallazgos originales, en que se emplearon ratas como sujetos, pueden generalizarse al mono, 
pero el criterio de estabilidad debe ser modificado en los experimentos llevados a cabo con ellos, 
lo cual no merma la generalidad de los datos. Si se utilizara el mismo criterio para ambas especies, 
no especificaríamos estados conductuales equivalentes en cada animal. Así, pues, la capacidad del 
criterio para seleccionar un estado reproducible, es su principal característica definitoria. 


Si el criterio de estado estable da lugar a relaciones funcionales ordenadas y replicables, podemos 
aceptarlo como adecuado, sin que necesite, de hecho, representar el estado estable último de la 
conducta en cuestión. Es posible que una exposición del sujeto más dilatada a un conjunto de 
factores experimentales produzca una modificación conductual más profunda que supere el nivel 
que se ha fijado arbitrariamente como estado estable. Sin embargo, si el estado seleccionado 
mediante el criterio de estabilidad es tal que la conducta debe pasar inevitablemente a través de 
él, al dirigirse hacia el estado estable final, los datos que se obtendrán serán ordenados y 
significativos. 


Dado que es necesario adoptar, en experimentos sobre estados estables, algún criterio de 
estabilidad, y debido también a que rara vez existen dos experimentos duplicados exactamente en 
todos sus aspectos, se necesita un considerable grado de experiencia e intuición para seleccionar 
un criterio apropiado. Una selección inadecuada puede muy bien convertir un experimento en un 
estudio piloto. La experiencia del investigador estará constituida por sus propias observaciones de 
estabilidad en experimentos parecidos, por los resultados de estudios descriptivos de larga 
duración, por el grado de variabilidad al que está acostumbrado en su propio laboratorio, por su 
conocimiento sistemático del área que investiga, así como por la experiencia de otros 
experimentadores. Esta última fuente de información debe valorarse con precaución, puesto que 
los criterios de estabilidad sólo serán transferibles de un laboratorio a otro si ambos laboratorios 
son equiparables en cuanto al nivel general de control experimental que se ha alcanzado en ellos. 
Así, por ejemplo, el criterio de estabilidad adoptado por un laboratorio en su programa de 
investigación sobre ciertos tipos de programas de reforzamiento, se ha definido de este modo: 


Para calcular la estabilidad no se toman en consideración los siete primeros días de cualquier programa de 
reforzamiento. Durante los seis días siguientes, se compara la media de los tres primeros días con la media 
de los tres últimos, de modo que si la diferencia entre estas medias es menor del 5 por ciento de la media de 
los seis días en conjunto, se considera que el sujeto se ha estabilizado, y se pasa al programa siguiente. Si la 
diferencia entre las medias parciales es mayor del 5 por ciento de la media total, se añade un día más de 
experimentación, y se llevan a cabo cálculos similares para este día y los cinco inmediatamente anteriores. 
Estas ampliaciones del experimento, y los cálculos de estabilidad, se continúan diariamente hasta que el 
sujeto cumple con el criterio del cinco por ciento mencionado (67, página 567). 


Este criterio es relativamente estricto, a pesar de que sus autores no están convencidos de su 
validez general. Lo que quiero resaltar es que sólo aquellos experimentadores, cuyos laboratorios 
se caractericen por una meticulosa atención hacia los detalles del control experimental, podrán 
utilizar el mismo criterio de estabilidad. La variabilidad que de otro modo se obtendría, sería tan 
grande que deberían pasarse la vida, si fueran tan tercos, en el mismo experimento inacabado. 
Aun en el caso de que se cumpliera el criterio por casualidad, debido a la acción de la variabilidad 
incontrolada, los datos obtenidos serían caóticos. Como consecuencia, o bien se abandonaría el 
experimento (con la consiguiente pérdida de tiempo y esfuerzo), o bien no serían válidos los datos 
obtenidos (con la confusión sistemática consiguiente). 


Los dos criterios de estabilidad descritos hasta el momento han sido, en un sentido simplista, de 
naturaleza estadística. Es ésta una característica inevitable de tales criterios, dado que por fuerza 
implican comparaciones entre varios conjuntos de observaciones. Sin embargo, no se requieren 
técnicas estadísticas de gran complejidad, las cuales incluso pueden resultar inadecuadas. El grado 
de variabilidad que se podrá tolerar en la definición de un estado estable resultará determinado 
por la consistencia de las relaciones funcionales obtenidas con él, así como por el grado de control 
experimental que pueda alcanzarse. En estos casos, la teoría estadística no tiene ninguna utilidad. 


Es éste un caso, además, en que la significación experimental y estadística no sólo son distintas 
sino que pueden resultar también opuestas. Así, un estado estable definido por diferencias 
estadísticamente insignificantes en cuanto a la conducta emitida a lo largo de un dilatado período 
de tiempo, puede resultar totalmente inútil desde un punto de vista experimental en el caso de 
que un alto grado de variabilidad contribuya a la evaluación estadística. Una descripción 
estadística del estado estable puede resultar apropiada, pero no se puede substituir la evaluación 
experimental por una evaluación estadística de la estabilidad. Si la experiencia del investigador, 
sea como fuere que la haya conseguido, no le basta para permitirle seleccionar un criterio de 
estabilidad útil al diseñar y llevar a cabo experimentos sobre estado estable, ninguna manipulación 
estadística podrá sacarle del atolladero. 


La experiencia acumulada y el buen juicio experimental también contribuyen a la selección de 
criterios de estabilidad de otro modo distinto. El criterio particular elegido puede depender, en 
parte, de la economía del montaje en un laboratorio concreto. El criterio descrito más arriba, por 
ejemplo, que requiere un cálculo y comparación diarios de medidas parciales y totales, quizá para 
varios sujetos, implica un trabajo considerable. Un método alternativo consistiría en exponer 
todos los sujetos a cada valor de la variabilidad independiente durante el mismo período de 


tiempo, y definir el conjunto final de observaciones como el estado estable de la conducta en 
cuestión. 


Así, por ejemplo, se podría exponer cada sujeto a un programa dado durante 100 horas, y aceptar 
como estado estable la conducta media que tiene lugar en las 30 horas finales. El que un 
procedimiento como éste resulte máximamente eficaz, dependerá de observaciones previas sobre 
el período global de tiempo en que es probable que una población de sujetos alance la estabilida d, 
y deberá seleccionarse, naturalmente, un período de exposición lo suficientemente largo para 
abarcar el sujeto más lento. El criterio de estabilidad debe seleccionar también, en este caso, el 
estado estable final, en lugar de uno intermedio, ya que de otro modo los sujetos podrían 
detenerse en estadios distintos en su aproximación a la estabilidad última. 


Mientras que el primer tipo de criterio implica cálculos, llevado a cabo normalmente por el 
personal de un laboratorio, es probable que un criterio basado en un período de tiempo fijo 
alargue la duración del experimento, ocupando el equipo de control y programación. Así, pues, la 
elección de uno de los dos métodos de definir la estabilidad dependerá, en parte, de la 
disponibilidad relativa de horas de trabajo del personal y de horas de funcionamiento de los 
aparatos. El laboratorio que cuente con una pequeña dotación de personal y un elevado 
presupuesto en equipo automático, probablemente adopte criterios de estabilidad de intervalo 
temporal fijo. En el caso opuesto, probablemente se adopte un criterio de estabilidad que 
implique un cálculo humano más o menos complejo. 


Los tres criterios de estabilidad descritos hasta el momento incluyen todos una o más restricciones 
diseñadas para eliminar de las mediciones los confusos efectos de los estados de transición 
iniciales. En dos de los casos, la evaluación del estado estable no empieza siquiera hasta que ha 
transcurrido un número predeterminado de horas de experimentación desde la introducción de 
un nuevo valor de la variable independiente. Por lo tanto, se pasar por alto, arbitrariamente, un 
cierto número de datos. Esta fase correspondiente al “criterio previo” cumple con una función 
importante. Al poder producirse una transición lenta de un estado conductual a otro, 
particularmente si el cambio en el factor experimental es ligero, podría cumplirse con un criterio 
de estabilidad aún antes del comienzo de la transición, con lo que se sacaría la conclusión errónea 
de que dos valores sucesivos de la variable independiente producen estados conductuales 
idénticos. Por lo tanto, suele llevarse a cabo un intento de adoptar una fase de criterio previo de 
suficiente duración para asegurarse de que el cambio conductual, si es que tiene que ocurrir, haya 
empezado al menos antes de que se examinen los datos para ver si cumplen con el criterio 
definitivo. 


La rapidez de una transición de un estado a otro puede estar en función de la magnitud de la 
diferencia entre los dos valores de la variable experimental, o bien puede ser una función de la 
dirección del cambio. Así, por ejemplo, un cambio en el intervalo respuesta-shock de 20 a 15 
segundos puede ir seguido muy lentamente por el correspondiente aumento en la tasa de 
respuesta. Un cambio de 30 a 15 segundos, sin embargo, quizás produzca una transición rápida. 
Además, mientras que un cambio de 30 a 15 segundos, que probablemente produzca un aumento 


casi inmediato en la frecuencia de administración de shocks, es probable que tenga como 
resultado un ajuste conductual rápido, un cambio en el intervalo respuesta-shock en dirección 
opuesta, de, por ejemplo, 30 a 60 segundos, posiblemente produzca una adaptación conductual 
más paulatina. Por lo tanto, la fase correspondiente al criterio previo, deber ser lo suficientemente 
larga para abarcar todas estas eventualidades. De otro modo, tal vez se cumpla el criterio aun 
antes de haber empezado la transición, con lo que resultará imposible volver a un estado 
conductual dado a partir de líneas de base distintas. 


Con frecuencia debe tomarse una precaución similar de tipo más local al evaluar un estado 
estable. No sólo hay efectos de transición a largo plazo de un estado conductual a otro, sino que 
también aparecen, en muchos casos, estadios de transición al principio de cada sesión 
experimental. Se observa con frecuencia, por ejemplo, que la tasa de respuesta al principio de una 
sesión, difiere de la tasa observada al final de la misma sesión, así como de la tasa emitida al final 
de la precedente. Las ratas blancas suelen recibir, en un procedimiento de evitación, un cierto 
número de shocks con muy poca separación temporal entre sí al principio de una sesión, antes de 
adoptar un esquema de respuestas eficiente. Los monos, en un programa de reforzamiento de 
intervalo fijo, pueden mostrar una curvatura poco pronunciada en los intervalos iniciales de la 
sesión. Estos estados locales de transición suelen recibir el nombre de “efecto de 
precalentamiento”. 


Disponemos, sin embargo, de poca información de tipo experimental sobre estos efectos de 
precalentamiento. Al evaluar los estados estables, estos efectos suelen ser, o bien absorbidos por 
los datos utilizados para evaluar el criterio de estabilidad, o bien excluidos explícitamente de dicho 
criterio. Así, los datos utilizados para la evaluación del criterio de estabilidad podrían tomarse, por 
ejemplo, de la porción final de cada sesión experimental únicamente. 


Surge un problema de importancia al excluir datos, tanto si éstos pertenecen a la fase de criterio 
previo, como si corresponden a la fase de precalentamiento. Los estados de transición son de un 
interés potencial como fenómenos conductuales por sí mismos. También es probable que el 
estado de transición, ya sea a largo plazo o local, contenga algunas de las claves para la 
comprensión del estado estable subsiguiente. La variabilidad de las fases de precalentamiento 
puede explicar, en parte, la variabilidad observada en los estadios terminales en las sesiones 
experimentales, dado que la duración del período de precalentamiento en un proceso de evitación 
puede determinar de un modo decisivo la tasa de respuesta final. En general, los procesos 
conductuales en espiral que tienen lugar durante la fase de transición correspondiente al criterio 
previo tienden a determinar el estado final de la conducta. Tales efectos no invalidan las 
relaciones funcionales que describen la conducta en estado estable, pero pasarlos por alto puede 
retrasar una comprensión más compleja de la función. 


El investigador se enfrenta, pues, con un dilema, al diseñar experimentos manipulativos sobre 
estados estables, puesto que se ve forzado a adoptar un criterio de estabilidad y al hacerlo 
renuncia a tomar en consideración algunos aspectos, posiblemente importantes, de los procesos 
conductuales en que está interesado. Es importante darse cuenta de que este problema implica 


dos requisitos, uno de los cuales es la descripción del estado estable con respecto a su relación 
funcional con la variable independiente. El otro consiste en la búsqueda de una descripción 
sistemática dentro de la cual dicha función pueda encontrar su lugar en relación con otros 
procesos conductuales. Los criterios de estabilidad, a pesar de todos sus defectos, son necesarios 
para resolver el primer problema. Quizás se requiera un enfoque experimental distinto para el 
segundo, si los procesos sistemáticamente relacionados implican estados de transición en vez de 
estados estables. Añadiré algo más a este punto en el capítulo 10. 


Evidentemente, queda un gran margen para el error al seleccionar un criterio de estabilidad 
válido. En ocasiones, en error puede pasar desapercibido hasta que el experimento ha avanzado 
hasta un punto en que los datos ponen de manifiesto que el criterio de estabilidad elegido no es 
satisfactorio. En este caso, deberá desecharse la investigación llevada a cabo hasta el momento y 
diseñarla de nuevo. Sin embargo, incluso si se emplea un criterio que en general sea satisfactorio, 
puede aparecer un pequeño número de excepciones, que quizá se manifestarán como puntos 
desviados de las relaciones funcionales obtenidas. Cuando estos puntos desviados son pocos en 
comparación con el total de puntos obtenidos en el experimento, es legítimo determinar de nue vo 
sus valores experimentalmente. Las desviaciones, además se der pocas, deben ser también 
asistemáticas, ya que de otro modo sería más razonable suponer que representan un proceso 
conductual real que deberá ser investigado en lugar de eliminarse. El experimento sobre conducta 
de evitación, cuyo criterio de estabilidad se ha descrito anteriormente, arrojó un total de 138 
puntos experimentales comprendidos en las funciones empíricas. De estos, cinco resultaron 
marcadamente desviados de la tendencia general que presentaban los demás datos. Dado que 
estos cinco puntos parecían corresponder a valores de los intervalos shock-shock y respuesta- 
shock sin ninguna relación sistemática entre sí, se determinaron todos por segunda vez, después 
de lo cual se alinearon junto a los otros datos. 


Una ocasional falta de adecuación en el criterio de estabilidad puede hacerse patente antes de 
haberse obtenido todos los datos, y en estos casos, no sólo es permisible una cierta elasticidad en 
el diseño experimental, sino también deseable. En ocasiones, es posible que el sujeto cumpla con 
el criterio escogido, si su conducta permanece dentro de los límites tolerables de variabilidad, 
aunque siga mostrando una continuada tendencia a cambiar en su conducta. Estos casos resultan 
fácilmente detectables, y es más probable que se produzcan cuando el criterio de estabilidad 
viene definido por un período temporal fijo. Así, por ejemplo, cien horas pueden ser suficientes 
para que la conducta alcance un estado estable previamente definido en la mayoría de los casos 
de un experimento dado, aunque en ocasiones e posible observar cómo la conducta continúa 
cambiando sistemáticamente al final de este período. Es imprudente, en este caso, aferrarse 
ciegamente al criterio, y lo que debe hacerse es mantener, sin ningún cambio, las condiciones 
experimentales durante algunas horas más. El propósito del experimento es, después de todo, 
investigar la conducta de estado estable, y si se debe elegir entre la estabilidad y un criterio 
ocasionalmente inadecuado, deberá modificarse el segundo. 


Las modificaciones ad hoc del criterio de estabilidad conllevan, evidentemente, un claro riesgo. 
Una razón importante para aferrarse a un criterio de estabilidad previamente determinado, es el 


prevenir la selección arbitraria e inconsciente de sólo aquellos datos que el experimentador desea 
ver. Sin un criterio especificado, el investigador puede decidir, sin el suficiente fundamento, que se 
ha alcanzado un estado estable cuando la conducta se ajusta a sus deseos. Debido a ellos, las 
excepciones al criterio de estabilidad deben ser solamente ocasionales en relación con el total de 
datos obtenidos. Si, por el contrario, resultan frecuentes, el mejor procedimiento será comenzar el 
experimento de nuevo, utilizando esta vez un criterio más estricto. El investigador no debe 
exponerse a la acusación de que detiene los estados de transición en puntos calculados de 
antemano para obtener los datos que desea. 


Al publicar sus hallazgos, el investigador deberá hacer constar, incidentalmente, cualquier 
excepción de haya hecho al criterio de estabilidad. 


VARIABILIDAD Y CRITERIO DE ESTABILIDAD 


Los criterios de estabilidad conllevan una especificación del grado de variabilidad que un 
experimentador considera permisible en la definición de un estado estable. Sin embargo, dicha 
especificación debe ir precedida de una importante consideración: si los datos son 
extremadamente variables, ya sea debido a una técnica experimental deficiente o a una 
comprensión inadecuada de los procesos implicados, ninguna especificación de la variabilidad 
tolerable permitirá obtener relaciones funcionales ordenadas. La utilidad de un criterio de estado 
estable está en función inversa del nivel de variabilidad incontrolada, lo cual es simplemente otra 
forma de decir que los estados estables no se pueden investigar experimentalmente a menos que 
realmente se puedan observar. Así, la labor previa a cualquier estudio paramétrico de una 
conducta en estado estable deberá consistir en refinar las técnicas de control hasta que se 
consigan eliminar de los datos todas las fluctuaciones apreciable. Sólo entonces un criterio de 
estabilidad será experimentalmente significativo. 


Ciertos tipos de fluctuaciones, particularmente las de tipo sistemático, no pueden eliminarse por 
medio de refinamientos técnicos. De hecho, quizás se intensifiquen a medida que el nivel de 
perturbación general se reduzca. Más adelante trataré este tema de nuevo; sin embargo, me 
gustaría mencionar ahora los cambios sistemáticos que pueden producirse en la propia 
variabilidad en función de las operaciones experimentales. Al seleccionar un criterio de estabilidad 
debe considerarse la probabilidad de tales cambios. Podría esperarse, por ejemplo, que la 
conducta que se emite a una tasa baja se caracterizará por un nivel, también bajo, de variabilidad 
absoluta en comparación con la conducta emitida a una tasa alta. Si este fuera el caso se podría 
utilizar, entonces, un criterio de estabilidad ajustable, de modo que el experimentador pudiera 
incorporar a dicho criterio un mecanismo que tuviera en cuenta los cambios sistemáticos en 
variabilidad. 


Uno de los criterios ya descritos es de este tipo. Se requería que la diferencia entre las tasa de 
respuesta medias en dos grupos sucesivos de cada tres sesiones fuera el cinco por ciento de la tasa 


media del total de seis días, antes de que se pudiera aceptar a estabilidad. Este criterio permite 
una mayor laxitud en variabilidad absoluta cuando la tasa de respuesta es alta que cuando es baja. 


Si la propia variabilidad cambia en función de las operaciones experimentales, debería usarse 
algún tipo de criterio ajustable, puesto que de otro modo podrían obtenerse datos que llevarían a 
error. Supongamos, por ejemplo, que en vez de especificar la variabilidad permisible mediante un 
porcentaje utilizamos un criterio basado en la tasa absoluta de respuesta. Pongamos por caso que 
decidimos aceptar la estabilidad de una conducta cuando el intervalo de variación de las tasas de 
respuesta, a lo largo de seis días consecutivos, no sobrepase un valor de 0,5 respuestas por 
minuto. Este criterio fijo, independiente de los cambios sistemáticos en la variabilidad, impondría 
de hecho un requisito más estricto sobre los cambios caracterizados por una variabilidad absoluta 
mayor, a pesar de que la variabilidad relativa quizá fuera muy estable. Si en un experimento dado, 
las tasas de respuesta altas muestran una variabilidad mayor que las bajas, no requerirá más 
tiempo para cumplir con un criterio de estabilidad fijo cuando prevalezcan las primeras. El estado 
estable eventualmente alcanzado por las tasas de respuesta altas puede constituir un estadio 
conductual funcionalmente distinto de aquel que, en las tasas bajas, cumple con el criterio de 
estabilidad fijado. La relación funcional obtenida no representará, en estas circunstancias, un 
proceso conductual unitario. 


Sin embargo, un criterio ajustable tiene, también, sus peligros ocultos, dado que igualmente 
puede proporcionar datos erróneos si el método de ajuste no corresponde a las realidades de la 
conducta. En los programas de reforzamiento de razón fija, por ejemplo, las tasas de respuesta 
bajas pueden caracterizarse por un mayor nivel de variabilidad absoluta que las tasas de respuesta 
altas. Si el criterio de estabilidad permite una variabilidad mayor en las tasas altas, puede dar lugar 
a una imagen falseada de los estados estables. En este caso, el criterio será demasiado severo en 
el extremo inferior de la escala, y demasiado laxo en el superior. Una manera de solventar este 
problema es emplear un criterio de severidad tal que incluso en su aplicación más relajada sea 
suficiente para conducir la conducta hasta su estado estable final. 


Una segunda alternativa consiste en hacer preceder el experimento de una serie de estudios 
encaminados a evaluar la variabilidad per se, y diseñar a continuación un criterio de estabilidad 
basado en el resultado de estos estudios. Por ejemplo, en vez de expresar la variabilidad 
permisible mediante un porcentaje de la tasa global emitida durante el período en que se evalúa 
el criterio, se podría seleccionar un porcentaje de alguna función del inverso de la tasa global. 
Este criterio tomaría en consideración la variabilidad próxima que tiene lugar en las tasas bajas. 


La tercera alternativa consiste en hacer que el criterio se ajuste, no a alguna estimación de la 
variabilidad determinada de antemano, sino de la variabilidad observada, calculada 
empíricamente a medida que el experimento avanza. La diferencia tolerable, por ejemplo, entre 
las tasas medias de dos grupos sucesivos de cinco sesiones, puede permitirse que varíe de un 
estado a otro, no como función de la tasa global, sino como función de la variabilidad global. Así, si 
la variabilidad es alta, podemos aceptar una diferencia del 15 por ciento entre las dos medias, 
mientras que si es baja, quizá aceptemos solamente una diferencia del 3 por ciento. Este método 


no implica suposiciones previas sobre la relación entre la variabilidad y las manipulaciones 
experimentales. 


Hay un tipo final de criterio de estabilidad que resulta particularmente difícil de especificar: al 
criterio basado en la simple inspección visual de los datos. Generalmente, no suele utilizarse un 
criterio de estabilidad de este tipo en estudios paramétricos en que los valores cuantitativos que 
asumen las medias conductuales son de importancia crítica; sin embargo, mucho experimentos 
están dirigidos simplemente a la exploración de variables relevantes, con poco o ningún interés en 
lo que toca a sus efectos cuantitativos exactos. Ferster y Skinner, en su libro Programas de 
Reforzamiento,** han presentado los resultados de un magnifico programa de investigación que 
duró seis años, dedicado en gran parte a experimentos de este tipo. Sus investigaciones incluían 
un estudio de un cierto número de variables relevantes a la conducta controlada bajo diversos 
programas de reforzamiento. En los casos en que se interesaban por la conducta en estado 
estable, los criterios de estabilidad estaban basados, en gran medida, en la inspección a simple 
vista de los registros acumulativos. Este procedimiento, a pesar de lo arbitrario que pudiera 
parecer, dio lugar a datos de gran generalidad. 


py 


Uno de los requisitos básicos para el éxito del “criterio por inspección visual” es que las 
manipulaciones experimentales den lugar a grandes cambios conductuales. Si los cambios son lo 
suficientemente marcados para resultar fácilmente identificables en una inspección visual, esta 
inspección aumenta automáticamente si validez como criterio de estabilidad. Un criterio de corte 
más cuantitativo podría poner de manifiesto que la conducta en cuestión se halla todavía bajo 
cambio, y una evaluación más precisa del efecto ejercido por la variable independiente 
probablemente requeriría una especificación conductual más estricta. Sin embargo, la 
demostración del hecho de que una variable dada es efectiva, no requiere la consecución de un 
estado estable estrictamente definido, siempre y cuando el cambio cuya existencia se ha 
demostrado sea lo suficientemente intenso para sobrepasar ampliamente las perturbaciones 


normales de la línea de base. 


Un buen ejemplo de todo ello lo constituye la demostración de Ferster y Skinner de la eficacia de 
un time-out para desarrollar y mantener la curvatura, en el registro acumulativo de la conducta 
controlada por programas de reforzamiento de intervalo fijo largos. En un tipo de experimento, el 
intervalo fijo se programó del modo clásico, poniéndose el reforzamiento a disposición del animal 
45 minutos después de que hubiera tenido lugar el reforzamiento anterior. Después de una 
observación prolongada de esta conducta de línea de base, se introdujo el time-out 
inmediatamente después de uno de cada dos reforzamientos. Ello significaba, simplemente, que el 
experimento se “cerraba” durante 20 minutos después del reforzamiento correspondiente. 
Los aparatos de programación se desconectaban durante este time-out de 20 minutos, y se 
apagaban por completo las luces del recinto experimental (34, páginas 185-226).bajo esta 
situación de time-out cesaba completamente la conducta que se estaba registrando. Sin embargo, 
durante los intervalos que seguían al time-out, la conducta cambiaba radicalmente, tal como 
puede verse en la figura 30. Es evidente que la introducción del time-out después del 
reforzamiento producía un marcado aumento de la curvatura de intervalo fijo. 
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FIGURA 30.Registros acumulativos de la conducta de una paloma bajo un programa de 
reforzamiento de intervalo fijo de 45 minutos, en el cual tenía lugar un time-out de 20 minutos 
después de cada dos reforzamientos. La conducta típica emitida durante los intervalos que no van 
precedidos de time-out está representada por las curvas de la izquierda, mientras que las de la 
derecha representan la conducta correspondiente a los intervalos precedidos por un período de 
time-out de 20 minutos de duración. (De Ferster y Skinner, 34, p. 195.) 


Es probable que ninguno de los dos grupos de registros que aparecen en la figura 30 corresponda 
a un estado estable final, dentro de los límites de variabilidad tolerable que podría definir un 
criterio riguroso. A pesar de ello, también resulta evidente que el time-out constituye una variable 
sumamente poderosa, cuyos efectos son lo suficientemente intensos para reflejarse claramente 
en el registro acumulativo. Se podría exigir una especificación más precisa de la estabilidad si 
estuviéramos interesados, pongamos por caso, en la relación cuantitativa existente entre la 
curvatura y la duración del time-out. El experimento de Ferster y Skinner, sin embargo, cumple de 


sobras con su misión. 


Naturalmente, el criterio de inspección visual no es un procedimiento completamente arbitrario. 
Para aplicarlo con éxito, el experimentador debe estar respaldado por una experiencia 
considerable, adquirida tanto en su propio laboratorio como en trabajos llevados a cabo en otros 
laboratorios. Por ejemplo, el primer grupo de registros que aparece en la figura 30, que muestra la 
línea de base de intervalo variable sin la aplicación del time-out, representa el punto final de 
muchas horas de experimentación. Basándose en su experiencia en estos y otros procedimientos, 
estos investigadores tenían razones suficientes para esperar que no se produjeran cambios 
ulteriores de consideración en la conducta del sujeto, dentro del tiempo que normalmente 
ocupaban sus experimentos. Aunque el punto divisorio elegido no se había determinado 
previamente según un criterio de estabilidad cuantitativamente especificable, tampoco se debía a 
un capricho. 


Otro tipo de datos que apoya este procedimiento se deriva de una demostración de la 
reversibilidad. En una tercera fase del experimento representado en la figura 30, se retiró el time- 
out, recobrándose la línea de base original. Esta reversibilidad justifica por sí misma el uso del 
criterio de inspección visual, puesto que, a pesar de que tal vez sea imposible recuperar la 
conducta de línea de base en su forma original exacta, sus características son de tal naturaleza que 
demuestran concluyentemente la importancia del time-out. Debería incluirse siempre, en el 
diseño de experimentos que exploren la relevancia de una variable en la conducta en estado 
estable, una vuelta a la situación original, tanto si se evalúa la estabilidad por medio de un criterio 
de inspección visual, como si se utiliza un criterio de estabilidad cuantitativo. 


La confianza del experimentador en un criterio de estabilidad de inspección visual, puede verse 
aumentada en virtud de datos colaterales del tipo que se obtienen en un programa de 
investigación intensivo y de larga duración. La replicabilidad, tanto directa como sistemática, 
contribuirá a aumentar la validez del criterio. De esta forma, una justificación adicional del criterio 
empleado en el experimento que acabo de citar, se deriva de la replicación sistemática del efecto 
en cuestión en otras situaciones experimentales (34, páginas 422-429). Se demostró, por ejemplo, 
que el time-out ejercía un control similar sobre la curvatura cuando se administraban programas 
de reforzamiento de intervalo fijo y de razón fija combinados en tándem. Es decir, que el 
reforzamiento tenía lugar sólo después de la emisión de un número de respuestas fijo siguiendo 
inmediatamente a la consecución de un intervalo fijo. El requisito de razón fija, añadido al 
intervalo fijo, da lugar a marcados cambios en la conducta, pero el efecto del time-out sigue 
siendo esencialmente el mismo. La evaluación del criterio de inspección visual debe tener en 
cuenta este tipo de replicaciones, dado que la generalidad de los hallazgos constituye la 
comprobación última de la validez de cualquier criterio de estabilidad. 


A pesar de que un experimentador puede conferir validez a experimentos concretos de estado 
estable, cuyo diseño implique el uso de criterios de estabilidad de inspección visual, quizá le 
inquiete el problema de reproducir los datos en su propio laboratorio. ¿Cómo sabe que los estados 
estables que evalúa mediante la inspección visual, a la luz de su propia experiencia, son los 
mismos que los estados que han sido observados por otro experimentador? El problema es real y 
a él se enfrentan científicos de muchas especialidades. Con el fin de evitar estas dificultades, un 


experimentador debería hacer públicos los datos en que basa su estimación de la estabilidad. 
Cuando su estimación se haga por simple inspección visual, los registros deberán ponerse a 
disposición de otros investigadores para que puedan llevar a cabo la misma inspección. A veces es 
posible ahorrar un valioso espacio en la publicación de un experimento haciendo referencia a 
datos típicos aparecidos anteriormente, pero cuando el estado estable en cuestión constituye un 
descubrimiento original, es necesario presentarlo de modo que pueda ser replicado por otros 
científicos. 


CONDUCTA INESTABLE 


Los criterios de estabilidad, ni pueden seleccionarse a ciegas, no observarse servilmente, dado que 
en algunas situaciones la conducta no es estable en absoluto. Los métodos para enfrentarse con la 
conducta inestable diferirán entre sí según el tipo y grado de inestabilidad que se observe en cada 
caso particular. 


Cuando un procedimiento experimental da lugar a una conducta inestable, la primera precaución 
que el experimentador deberá tomar es la de asegurarse, dentro de límites razonables, de que la 
variabilidad observada no se debe a un control insuficiente de factores extraños al propio 
procedimiento. Esto equivale a decir que deberá eliminar estos factores, entre los cuales 
probablemente se hallen ruidos perturbadores, fallos en el mecanismo de reforzamiento, 
variaciones incontroladas en la intensidad de los shocks, chapuzas en los circuitos de 
programación, fluctuaciones excesivas de temperatura, etc. Después de haber eliminado estas 
variables y otras similares, puede estar razonablemente seguro de que la inestabilidad observada 
se debe casi exclusivamente a sus propias manipulaciones experimentales. Lo que debe hacer a 
continuación es examinar dicha inestabilidad y describirla de un modo tan completo como le 
permitan los métodos de que dispone. Solamente después de esta completa descripción, podrán, 
él y otros, decidir el mejor modo de enfrentarse a la inestabilidad que aparezca en experimentos 
subsiguientes. 


Una forma de inestabilidad se caracteriza por fluctuaciones cíclicas en la conducta. Los ciclos 
pueden variar desde aquellos que muestran una periodicidad fácilmente reconocible hasta los que 
aparentemente carecen por completo de una pauta consistente. En los casos más simples, como 
son los programas de reforzamiento de intervalo fijo y de razón fija, una operación experimental 
bien definida determina, en parte, la dimensión de los ciclos. Así, en un programa de intervalo fijo, 
el período del ciclo es constante, y viene definido por el tiempo mínimo que debe transcurrir entre 
reforzamientos. Cada reforzamiento inicia un nuevo ciclo, formado por una pausa y una 
aceleración en la tasa de respuestas. En el programa de razón fija, cada reforzamiento inicia 
igualmente un nuevo ciclo, pero en este caso su amplitud es constante, dado que la razón 
requerida de respuestas por reforzamiento determina la altura de cada ciclo, aunque su 
periodicidad puede variar. En el extremo opuesto, las fluctuaciones cíclicas de la tasa de respuesta 
durante la extinción, por ejemplo, no tienen ningún límite de amplitud o periodicidad determinado 
por cambios especificables de las condiciones experimentales. 


Cuando se fija operacionalmente alguna dimensión de una fluctuación cíclica, resulta 
relativamente fácil describir las características de los ciclos. La conducta puede incluso ser tratada 
como un fenómeno de estado estable. Así, por ejemplo, un programa de razón fija de magnitud 
intermedia generará cambios cíclicos en la tasa de respuesta. Sin embargo, la pauta que sigue al 
reforzamiento se mantendrá relativamente constante de un ciclo a otro, las tasas locales no 
presentarán diferencias, y, naturalmente, el número de respuestas que se emita en cada ciclo 
vendrá fijado por el propio procedimiento. Ciertas variables experimentales sólo producirán 
cambios, pongamos por caso, en la pausa postreforzamiento, cuya duración puede caracterizar el 
estado estable en función de los cambios que se produzcan en la variable experimental en 
cuestión. 


La selección de aquellos aspectos de la conducta que son estables constituye un método para 
manejar las formas conductuales que de otro modo resultarían inestable. Una segunda técnica 
frecuentemente empleada para tratar con la inestabilidad cíclica, consiste en llevar a cabo 
mediciones de grandes muestras de conducta solamente. Estas muestras deben ser lo 
suficientemente grandes para que la variabilidad cíclica resulte distribuida por igual entre todas 
ellas. Así, por ejemplo, en el reforzamiento diferencial de tasas bajas (DRL), se ha observado a 
menudo que los reforzamientos se agrupan, formando “racimos” separados por períodos en que 
la tasa de respuesta es relativamente alta. Un ejemplo extremo de ello aparece en la figura 31. 
Bajo este procedimiento, se requirió a una rata sedienta que espaciara sus respuestas, al menos 
20 segundos, una de otra, para poder obtener una gota de agua. Las pequeñas marcas diagonales 
que aparecen en el registro acumulativo de respuestas ilustrado en la figura 31, indican los 
reforzamientos, que sólo se administraban cuando el animal cumplía con el criterio de tasa baja. 
La tendencia a que dos o más reforzamientos tuvieran lugar muy cerca uno del otro, es claramente 
visible. La curva, por lo tanto, fluctúa, de un modo irregularmente cíclico, entre tasas de respuesta 
relativamente altas, y por consiguiente sin reforzar, y tasas bajas aproximadamente iguales al 
requisito mínimo de una respuesta cada 20 segundos. 


Una descripción de la tasa de respuesta que aparece en la figura 31, adolecería de una gran 
variabilidad si las tasas se midieran globalmente en períodos sucesivos, aunque ni siquiera 
sobrepasaran los 10 minutos. Algunos de los períodos de 10 minutos estarían ocupados por uno 
de los grupos de reforzamientos que aparecen en el ciclo, mientras que otros tal vez abarcarían 
solamente las porciones de tasa alta del registro. Finalmente, otros intervalos de 10 minutos 
contendrían distintas porciones de segmentos de la conducta formados por tasas altas y bajas. 
Una descripción de los efectos de una variable independiente determinada, basada en segmentos 
de la curva de 10 minutos de duración, resultaría embrollada por una tosca variabilidad de 
apariencia totalmente asistemática. Un método para enfrentarse a este problema consiste 
simplemente en aumentar el tamaño de la muestra conductual en que se mide la tasa. Así, en la 
situación de DRL, ha demostrado ser adecuada una muestra conductual que cubra un intervalo de 
dos horas de duración. A pesar de las variaciones cíclicas locales, la tasa de respuesta en períodos 
de dos horas sucesivos se mantienen relativamente constante, y la conducta a largo plazo se 
caracteriza por su estabilidad. 


H———— 100 RESPUESTAS 
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FIGURA 31. Registro acumulativo de la conducta de una rata en la que sólo conseguían 
reforzamiento las respuestas separadas 20 segundos o más de lo precedente. Las pequeñas 
marcas oblicuas correspondientes a los reforzamientos ilustran la naturaleza cíclica de esta 
conducta. 


El uso de muestras conductuales grandes con el fin de “suavizar” la inestabilidad cíclica es 
parecida, a un nivel distinto, al procedimiento de combinar los datos obtenidos en un grupo 
grande de sujetos con vistas a compensar la variabilidad individual, y adolece de limitaciones 
similares. Con un sujeto individual no se presentan, lógicamente, ninguno de los problemas 
derivados de la agrupación de diferencias individuales. En este aspecto, el método de utilizar 
grandes muestras conductuales pertenecientes a un individuo púnico, constituye un avance sobre 
la utilización de datos agrupados. Sin embargo, al utilizar este método, agrupamos aquellas 
variaciones conductuales que tienen lugar en un sujeto individual, dado que la tasa promediada de 
dos horas de conducta no hace desaparecer las fluctuaciones locales en mayor grado de lo que un 
promedio de grupo elimina las diferencias individuales. Todo lo que conseguimos utilizando el 
método de promedios es ocultar las variaciones cíclicas. Los efectos continúan estando presentes 
en la conducta, y no podemos suponer que carecen de importancia, particularmente cuando son 
sistemáticos. 


Antes de continuar con este tema, debería quedar claro que los datos obtenidos mediante 
promedios conductuales en un solo individuo son, al menos en dos aspectos, preferibles a los 
datos obtenidos de la conducta promediada de un gran número de sujetos. Una ventaja que ya he 
señalado, es la eliminación de un importante foco de variabilidad. Los promedios de grupo se ven 


contaminados tanto por la variabilidad intrasujeto como entre sujetos, mientras que los 
promedios individuales se hallan libres de la segunda. La segunda ventaja se deriva de una 
consideración sobre los procesos conductuales realmente descritos por los datos. Los datos de 
grupo suelen describir con frecuencia un proceso, o una relación funcional, que no tiene validez 
para ningún individuo. La validez de una descripción conductual obtenida mediante datos 
agrupados, estará en relación inversa a la magnitud de la variabilidad entre sujetos. Sin embargo, y 
esto es lo más importante, con frecuencia no disponemos de ningún medio para evaluar si un 
ejemplo dado de datos agrupados refleja fielmente, o no, los procesos conductuales individuales. 


Tal como he señalado anteriormente, los datos agrupados reproducibles describen algún tipo de 
orden en el universo y, como tales, pueden muy bien constituir la base de una ciencia. 
Sin embargo, será una ciencia de la conducta individual extremadamente tosca, y no será una 
ciencia de la conducta de grupos, en el sentido en que el término “grupo” es empleado por el 
psicólogo social. Su objeto de estudio lo constituirá la conducta promediada de individuos cuya 
única relación entre sí es el propio proceso de promediación. El lugar que corresponda a esta 
ciencia dentro del esquema de fenómenos naturales constituye un problema de opinión. A mi 
parecer, pertenece al estadístico actuarial, y no al investigador de procesos conductuales. 


Los datos promediados correspondientes a un solo individuo, por otra parte, proporcionan al 
menos una descripción real de la conducta del individuo en cuestión dentro de los límites de la 
medida empleada. A pesar de las fluctuaciones locales, una tasa de respuestas promediada sobre 
un intervalo de dos horas, constituye una descripción real de la conducta de un sujeto único. 
Tal vez seamos incapaces de describir la conducta en puntos concretos a lo largo del tiempo, pero 
podemos afirmar sin distingos que el sujeto ha emitido un número de respuestas dado a lo largo 
de un período de dos horas bajo determinadas condiciones experimentales, y que bajo 
condiciones distintas se ha obtenido una tasa media diferente. A pesar de que la descripción no es 
exacta, es válida para el individuo. 


El mayor problema que acarrea el uso de grandes muestras de datos individuales, a fin de suavizar 
las fluctuaciones cíclicas, no es, por tanto, una cuestión de representatividad de los datos. 
Constituye, por el contrario, un problema relacionado con la precisión y exactitud con que tales 
datos nos permiten avanzar en vuestra comprensión de los procesos conductuales. Agrupando las 
fluctuaciones cíclicas en una medición global única, como podría ser la tasa de respuestas media, 
podemos perder una importante información sobre las características de la conducta que se 
estudia. Una de las principales virtudes de la técnica de registro diseñada por Skinner, 
ejemplificada por los registros acumulativos de respuesta que he empleado en las ilustraciones, es 
la descripción, continúa y rápidamente visible, que proporciona de la conducta de un sujeto, 
momento a momento. Este tipo de registro nos permite evaluar la contribución de las 
fluctuaciones locales a una medicación sucinta. Para hacernos una idea más concreta de ello, 
examinemos las figuras 32 y 33. 


La figura 32 representa la conducta de un mono y una rata cuya conducta de apretar la palanca 
estaba reforzada con la administración de líquido bajo un programa de razón fija que requería 25 


respuestas por reforzamiento. La conducta muestra las características normalmente generadas 
por este programa. Al principio de la sesión se observan tasas de respuesta mantenidamente altas, 
pero a medida que los animales van quedando saciados, aumentar la frecuencia con que se 
producen las pausas post-reforzamiento. 
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FIGURA 32. Conducta de un mono y una rata bajo un programa de razón fija de 25 respuestas por 
reforzamiento. (Adaptado de Sidman y Stebbins, 79.) 
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FIGURA 33. Registros de la conducta de razón fija de los mismo sujetos que aparecen en la Figura 
32, obtenidos en sesiones experimentales antes de las cuales se les había alimentado con una gran 
cantidad del agente reforzador. (De Sidman y Stebbins, 79.) 


La figura 33 muestra la conducta de los mismos animales después de habérseles administrado una 
gran cantidad del agente reforzador inmediatamente antes del comienzo de la sesión 
experimental. La tasa de respuestas media, después de esta alimentación previa, es 
considerablemente menor que la registrada en la figura 32. Por lo tanto, el efecto de la operación 
de alimentar previamente a los sujetos podría describirse como una disminución general de la tasa 
a lo largo de toda la sesión experimental. Esta descripción sería completamente exacta, pero 
apenas refleja lo que en realidad ha acontecido, dado que, cuando los animales responden, lo 
hace a la misma tasa, tanto después de una alimentación previa como sin ella. El efecto principal 
de la operación de administrar comida antes del comienzo de la sesión es el de alterar la pauta 
cíclica de tasas de respuesta cero y máxima. Después de dicha operación, las pausas 
postreforzamiento aparecen con mayor frecuencia y más al principio de la sesión; sin embargo, 
cuando los animales empiezan a responder, adoptan inmediatamente su tasa alta y constante 
característica, lo cual nos proporciona una interpretación muy distinta de los efectos ejercidos por 
la saciedad sobre la conducta de razón fija, a la que obtendríamos considerando solamente la tasa 
de respuestas media a lo largo de toda la sesión. 


En ocasiones, el mismo hecho de la ciclicidad puede constituir el dato decisivo, en cuy o caso será 
necesario diseñar un sistema de medición que nos permita establecer el tipo y la magnitud de la 
fluctuación. Existe solamente un reducido número de experimentos en que se haya examinado la 
ciclicidad per se con detalle apreciable. La mayor parte de las mediciones de fluctuaciones 
conductuales se han derivado de la simple inspección visual de los datos, o, si se han llevado a 
cabo con alguna precisión, ha sido, de modo muy sucinto, a partir de muestras conductuales 
relativamente grandes. En la primera de estas dos categorías se incluyen las observaciones de las 
fluctuaciones que tiene lugar en la tasa de respuesta durante la extinción experimental de una 
respuesta. La curva acumulativa de extinción registrada después de un reforzamiento continuo, 
muestra marcadas fluctuaciones, con ciclos irregulares de pausas y tasa de respuesta altas, 
alternativamente. Sin embargo, el proceso de extinción que tiene lugar después del reforzamiento 
intermitente, es relativamente uniforme, y presenta poca perturbación debida a fluctuaciones 
considerables en la tasa de respuesta. Esta diferencia, que a mi parecer constituye una de las más 
fructíferas observaciones en el estudio de la conducta, no ha sido explorada mucho más allá de la 


de la observación original.** 


Ningún investigador ha diseñado todavía una herramienta descriptiva 
lo suficientemente precisa para “capturar”, de un modo cuantitativo, el tipo de fluctuación 
irregular que muestra la tasa de respuesta durante la extinción. Así, hasta que no se desarrolle una 
medida adecuada de la ciclicidad per se, los fenómenos de este tipo continuarán siendo problemas 
desafiantes, pero sin resolver. Los experimentos cuyo diseño requiera la información 


proporcionada por estos datos, se verán limitados por nuestra actual falta de adecuación técnica. 


Se dispone de técnicas para manejar ciertos tipos de oscilaciones conductuales, particularmente 
aquéllas en que la conducta fluctúa entre dos o más estados fácilmente identificables. Los sujetos 
pueden mostrar, por ejemplo, alguna forma de alteración entre dos respuestas. Es posible, a 
través de la medición de las secuencias en que se producen las dos respuestas, caracterizar su 
fluctuación con respecto a su frecuencia y a su pauta. Así, si denominamos las respuestas con las 


letras A y B, podemos medir la propiedad de que se produzca cada una de las cuatro secuencias 
dobles posibles, AA, BB, AB y BA. ¿Con qué frecuencia la respuesta A va seguida de otra respuesta 
A, y con qué frecuencia por una respuesta B, etcétera? Estas observaciones nos darán alguna 
indicación sobre la magnitud de la oscilación que tiene lugar entre ambas respuestas. 


Pueden llevarse a cabo mediciones similares de secuencias de tres, cuatro o más respuestas, 
deteniendo el análisis en el punto donde la regularidad desaparece. Este punto constituirá, por sí 
mismo, otra medida de la ciclicidad de la alternación de respuestas. De este tipo de mediciones 
podemos derivar incluso una descripción sucinta de la ciclicidad global con respecto a la 
“incertidumbre” con que podemos predecir las próximas respuestas en una secuencia dada. ?*”. ** 
Aunque las técnicas de medición de este tipo, derivadas de un área popularmente conocida como 
“teoría de la información”, demuestran ser cada vez más útiles, todavía sufren del hecho de 
requerir una muestra de datos grande. La descripción estadística que brindan es similar, en este 
aspecto, a una tasa de respuestas media. Ambos tipos de medida pasan por alto fluctuaciones 
locales que pueden tener una gran importancia funcional. 


Las fluctuaciones cíclicas constituyen, por lo tanto, un grave desafío al estudio de la conducta en 
estado estable, y, a medida que continuemos refinando nuestros métodos de control 
experimental, es probable que este desafío llegue a ser cada vez más acuciante. Indudablemente, 
nos pasa desapercibida una gran parte de la ciclicidad funcional debido a que se halla oculta por la 
variabilidad que nuestras técnicas actuales nos fuerzan a aceptar; sin embargo, no se trata 
exclusivamente de un problema de medición, dado que si podemos aumentar nuestra 
comprensión de los factores que sustentan la ciclicidad conductual, tal vez resulte posible diseñar 
nuestros procedimientos experimentales de modo que la regularidad de los ciclos resulte 
incrementada. Ante las fluctuaciones irregulares es cuando surgen los problemas de medición 
graves. Los ciclos estables, tal como hemos visto, pueden seguirse paso a paso a lo largo de un 
experimento sin pérdida de detalle a causa de la promediación. 


¿Cómo podemos alcanzar un grado de comprensión de los procesos cíclicos que nos permita 
diseñar experimentos para estudiarlos con detalle? Naturalmente, cada caso requerirá su enfoque 
propio, pero existe un principio de orientación general que nos puede servir de guía. Cuando se 
observan ciclos conductuales en un experimento, y no hay estímulos externos con los que poder 
correlacionar los ciclos, pueden encontrarse a menudo las fuentes de la ciclicidad en la propia 
conducta. Si hemos mantenido las condiciones ambientales notablemente constantes, es probable 
que encontremos las variables causantes de la oscilación en la misma conducta que estamos 
examinando. Se conocen en este momento varios casos en los que la conducta genera las 
condiciones que producen su propia oscilación, y podemos esperar descubrir más casos 
mediante experimentos apropiadamente diseñados. Se ha demostrado, por ejemplo, que la 
conducta emitida bajo un largo programa de reforzamiento de intervalo fijo, se halla 
poderosamente influida, en un segmento dado, por el número de respuestas que se emitieron en 
los segmentos inmediatamente anteriores, así como en otros más remotos. He subrayado la 


naturaleza cíclica de este proceso en el capítulo 5, página 173. Mediante la técnica de time-out de 


Ferster y Skinner, es posible reducir al mínimo los efectos de variables que tienen su origen en la 


conducta precedente, y, por lo tanto, regularizar apreciablemente la curvatura característica del 
intervalo fijo.** 


La técnica de time-out, sin embargo, tal vez no resulte siempre apropiada para resolver este tipo 
de problema. Quizás sea deseable, en lugar de eliminar el control ejercido por la conducta 
precedente, aumentarla al máximo para facilitar así el estudio de sus componentes. De este modo, 
el experimentador puede disminuir la variabilidad del propio proceso cíclico, y, por consiguiente, 
incluirlo dentro de una descripción sistemática y cuantitativa. Antes, por ejemplo, he discutido la 
ciclicidad de los “codos” de un intervalo fijo en términos de los cambios operados en el número de 
respuestas emitidas por reforzamiento. Si el análisis es correcto, debe poder establecerse, por lo 
tanto, una conexión fundamental entre la conducta de intervalo fijo y la conducta de razón fija. 
Sin embargo, es posible que el número de respuestas no sea la única variable. La tasa de 
respuestas puede también resultar decisiva, así como la aceleración, la duración de la pausa que 
tiene lugar al principio del intervalo, y la cantidad de tiempo a lo largo del cual se mantiene la tasa 
terminal. Los experimentos diseñados con vistas a aislar estos rasgos pueden aumentar la 
regularidad de las variaciones cíclicas en el codo de intervalo fijo, facilitando así su manipulación y 
medición experimentales. 


El tono de tanteo que he adoptado en mi discusión indica que la inestabilidad cíclica en la 
conducta constituye un área relativamente inexplorada. Las implicaciones que ello conlleva para el 
diseño experimental no pueden precisarse con demasiada seguridad. Los esfuerzos 
experimentales realizados hasta este momento se han dirigido a la eliminación de la inestabilidad 
cíclica. A medida que aumentemos nuestra certeza con respecto a la adecuación técnica de 
nuestros procedimientos de control experimental, tal vez volvamos a estudiar con más detalle los 
estados inestables que originalmente hayamos logrado eliminar. El camino que en primer lugar he 
señalado para poder conseguirlo, consiste en estabilizar la inestabilidad. Cuando se puede lograr 
que la variabilidad se ajuste a una pauta, podemos asegurar que disponemos de una línea de base 
adecuada a partir de la cual medir los efectos ejercidos por las operaciones experimentales 
relevantes. El hecho de que el experimentador desee eliminar, o, por el contrario, estudiar la 
inestabilidad cíclica, dependerá del tipo de problema que se halle investigando. Si elige estudiar 
los cambios cíclicos que presenta la conducta, las técnicas tradicionales probablemente le sean de 
poca ayuda, e incluso pueden representarle un estorbo. Un trabajo de este tipo requerirá 
innovaciones, y el innovador no puede permitirse aceptar ninguna técnica o descubrimiento 
“establecido” por su valor aparente. 


X. Estados de transición 


Hemos visto algunos de los problemas que presenta la investigación de la conducta en estado 
estable: problemas de variabilidad cíclica e irregular, rasgos a largo plazo, tamaño de la muestra 
conductual, criterios de estabilidad, y reversibilidad. Nos encontramos con las mismas dificultades, 
algunas de ellas más acusadas, en los estudios de los estados de transición. El primer problema 
que debemos resolver al estudiar los estados de transición consiste en determinar sus límites. 
¿Cuándo empieza la transición y cuándo acaba? La respuesta a esta pregunta requerirá algún 
conocimiento de los estados estables que la limitan. A menos que las condiciones experimentales 
cambien antes de la consecución de un estado de transición, éste implicará siempre un cambio de 
un estado estable a otro. Por esta razón, el estudio de los estados de transición no puede 
divorciarse fácilmente del de los estados estables. 


En muchos procedimientos experimentales, el principio de una transición puede definirse 
operacionalmente como el punto en que cambiamos las condiciones experimentales. Así, por 
ejemplo, el principio de una extinción puede identificarse con el punto en que desconectamos el 
aparato administrador de reforzamientos. Incluso esta definición relativamente simple es, sin 
embargo, problemática. Supongamos que el estado estable inicial se mantiene mediante un 
programa de reforzamiento de intervalo fijo, y que el mecanismo administrador de comida se 
desconecta inmediatamente después de que tenga lugar un reforzamiento. Desde el punto de 
vista del sujeto, la extinción no empieza hasta que ha transcurrido el intervalo siguiente y el 
reforzamiento no se produce. En este momento, acabamos de entrar en terreno peligroso, dado 
que cada vez que el experimentador hace una suposición sobre el punto de vista del sujeto, corre 
el riesgo de falsear sus datos en el sentido de sus propias suposiciones. En este ejemplo, sin 
embargo, es poco probable que esto pueda llegar a suceder, dado que a pesar de que definir 
operacionalmente el punto en que el reforzamiento deja de presentarse al animal es ligeramente 
más complicado que establecer con exactitud el instante preciso en que se desconecta el 
mecanismo administrador de comida, no por ello resulta imposible. Las complicaciones provienen 
del hecho de que debamos tomar en consideración no sólo un cambio en el ambiente, sino 
también un cambio en las relaciones entre el ambiente y la conducta. 


Las ventajas y desventajas de este tipo de definición son de naturaleza práctica. Hay una ventaja 
inmediata en definir el comienzo de una transición con respecto a las operaciones que implican 
contingencias conductuales, ya que con este método es posible eliminar de las mediciones de la 
transición aquellos aspectos de la conducta que se hallan completamente bajo el control de las 
variables de estado estable procedentes. Supongamos, por ejemplo, que deseamos investigar la 
extinción como función de la longitud del intervalo fijo. A este fin, llevamos a cabo la extinción 
después de haber establecido estados estables de conducta bajo programas de intervalo fijo de, 
por ejemplo, 1, 5, 10, 20 y 40 minutos, y definimos el principio de la extinción por la operación de 
desconectar el mecanismo administrador de comida inmediatamente después de un 
reforzamiento. Nuestras mediciones de la extinción después de programas de intervalo fijo de 
diferentes longitudes incluirán. Por consiguiente, distintos segmentos de conducta que no habrán 
tenido ninguna oportunidad de “sentir” los efectos del cambio operado en las condiciones 


experimentales. De esta forma, después de un intervalo fijo de 10 minutos, los primeros 10 
minutos de conducta de extinción se hallarán totalmente bajo el control del programa. Sólo 
después de transcurrido este lapso, puede ponerse en relación el hecho de haber desconectado el 
mecanismo administrador de comida con la conducta. 


Sin embargo, si el intervalo fijo es de sólo un minuto, el cambio crítico en las contingencias se 
producirá casi inmediatamente después de haberse desconectado el mecanismo. Esta diferencia 
tendrá un gran efecto en nuestra comparación de la extinción que seguirá a intervalos fijos de uno 
y 40 minutos, y se reflejará en menor medida en nuestras comparaciones de puntos intermedios. 
Por el contrario, si definimos el comienzo de la extinción como el punto en que deja de 
presentarse el primer reforzamiento, nuestras medidas estarán libres de tales complicaciones. 


Un cambio en el tipo de contacto que la conducta establece con su ambiente no siempre define el 
comienzo de una transición de modo tan satisfactorio. Supongamos, por ejemplo, que la conducta 
de línea de base a partir de la cual iniciamos el cambio se halla mantenida por una contingencia 
variable, tal como un programa de reforzamiento de intervalo variable. Sería difícil, y 
probablemente carecería de sentido desde un punto de vista conductual, especificar el principio 
de la transición por el primer punto en que dejó de administrarse. La mejor solución en este caso 
sería utilizar un criterio de tipo operacional, midiéndose la transición a partir del instante en que 
se realizó el cambio en el aparato de programación. El grado de error introducido por este criterio 
podría especificarse en términos de la distribución de intervalos entre reforzamientos que se había 
perforado en la cinta programadora. 


Podemos aspirar, sin embargo, al desarrollo de técnicas más racionales para ¡identificar el 
comienzo de un estado de transición. Así, a medida que las variables que mantienen una muestra 
dada de conducta se identifiquen con mayor precisión, resultará posible medir un estado de 
transición a partir del momento en que dichas variables tomen contacto por primera vez con la 
conducta. Como caso hipotético, conveniente a nuestra exposición, supongamos, porque así nos 
interesa, que la tasa de respuestas generada por un programa de reforzamiento de intervalo 
variable se ha comprobado que se halla únicamente bajo el control de la frecuencia de 
reforzamientos. Si pasáramos a un nuevo valor del programa, podríamos medir la transición a 
partir del punto en que cambia la frecuencia de reforzamiento, dado que sabemos que es ésta la 
variable decisiva. 


Quizás este ejemplo no sea el más adecuado, pero lo he seleccionado debido a la dificultad 
adicional que conlleva. Un cambio en una variable tal como la frecuencia de reforzamiento 
necesitará, bajo muchas condiciones distintas, un largo período de tiempo para que sus efectos se 
reflejen en la conducta. Ello resultará especialmente cierto si la frecuencia se caracteriza por su 
variabilidad a corto plazo, con una constancia que se mantenga solamente a lo largo de períodos 
dilatados, como ocurre en el programa de intervalo variable. ¿De qué modo, pues, podremos 
determinar con precisión cuando un cambio en la frecuencia de reforzamientos entra en contacto 
con la conducta e inicia la fase de transición? 


Podríamos medir la distribución de las frecuencias de reforzamientos en segmentos sucesivos 
cortos de la conducta en estado estable, y seleccionar luego, como principio de la transición, aquel 
punto del nuevo programa en que la frecuencia del reforzamiento cae apreciablemente fuera de la 
distribución original. Sin embargo, no hay ninguna garantía, ni siquiera ninguna razón, para 
esperar que un cambio estadísticamente significativo en la frecuencia del reforzamiento 
corresponda a un cambio conductualmente significativo. Un criterio de este tipo debe basarse en 
una determinación racional, de la magnitud y consistencia del cambio que debe operarse en la 
variable antes de que sus efectos comiencen a reflejarse en la conducta. 


El estudiante tal vez se haya dado cuenta, en virtud de lo dicho antes, de que un estado de 
transición conductual puede incluir dos fases. Una de ellas es el tiempo necesario para que la 
nueva variable inicie un cambio; la otra, es la transición conductual que tiene lugar una vez que la 
nueva variable ha empezado a actuar. Aunque ambas fases son de interés, suelen confundirse en 
experimentos que incluyen estados de transición. 


Los estudios sobre aprendizaje, en que las dos fases se combinan de ordinario en una única 
medida, constituyen un ejemplo excelente. ¿Cuánto tiempo necesita un animal para alcanzar una 
conducta estable final de correr a un plato de comida situado en el extremo de corredor? La fase 
inicial de transición, que se supone que parte de un nivel de conducta nulo en este caso, puede no 
hallarse en absoluto bajo el control del reforzamiento empieza a tener efecto sobre la conducta 
medida, casi puede considerarse un problema psicofísico. ¿En qué punto del procedimiento la 
operación de reforzar empieza a ejercer un efecto apreciable? Una vez que este efecto inicial se 
haya empezado a manifestar, el resto de la fase de transición puede tomar un curso totalmente 
independiente, o puede, también, estar en función de la fase inicial. Ambas fases merecen 
estudiarse, y es de esperar que los adelantos metodológicos permitirán evaluar las dos fases 
independientemente una de otra. 


Las dificultades que implica la identificación del comienzo de un estado de conducta de transición 
son pequeñas en comparación con las que surgen al intentar determinar dónde termina. 
El problema consistirá en hallar los criterios que nos permitan trazar una línea divisoria entre el 
término de una transición y el comienzo del estado estable subsiguiente. ¿Cómo decidimos, por 
ejemplo, en el experimento de aprendizaje tradicional, que el aprendizaje se ha completado? 
Según el aspecto de la conducta que se mida, la respuesta a esta cuestión puede determinar 
poderosamente las conclusiones que se sacarán de un experimento dado. 


La figura 34 ilustra dos fases de transición. Ambas comienzan al mismo nivel conductual y alcanzan 
estados estables similares. Sin embargo, cada una llega al estado final siguiendo rutas distintas. 
Puede plantearse la pregunta de cuál de las dos transiciones se produce con mayor rapidez. 
El estudiante se habrá dado cuenta de que es ésta la pregunta que suele hacerse en los estudios 
experimentales sobre aprendizaje. Su respuesta dependerá del punto en que se juzgue que 
termina la transición. Así, si el experimentador corta su experimento por la vertical A, observará 
que la transición | se produce más rápidamente que la transición Il. Este procedimiento no es en 


absoluto infrecuente, ya que los experimentos sobre la adquisición de una conducta no suelen 
continuarse el tiempo necesario para que el sujeto alcance el nivel final de comportamiento. 
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FIGURA 34. Dos curvas de aprendizaje hipotético. 


Si, por el contrario, el experimento acabara en C (figura 34), podría muy bien sacar una conclusión 
distinta. Cuando se alcanza C, las dos curvas han transcurrido a lo largo de un gran segmento del 
experimento en que ha sido imposible distinguirlas entre sí. De este modo, si C se tomara como el 
punto terminal, podría concluirse que ambas transiciones tuvieron lugar con la misma rapidez. 
En realidad, las dos curvas han resultado similares en un intervalo de las abcisas tan largo, que 
algunas pruebas estadísticas podrían conducir a la conclusión de que no existe diferencia alguna 
entre ambas transiciones. En este caso, el error provendría de no detener el experimento lo 
suficientemente pronto. Los estados estables finales que aquí se presentan, se hallan 
inextricablemente ligados con las fases de transición. 


Una inspección visual de las curvas de la figura 34, sugiere que la transición | terminó en B, y que 
la transición ll lo hizo en B,. Si esto fuera correcto, deberíamos concluir que la transición | fue la 
más rápida de las dos. ¿En virtud de qué criterio cuantitativo podríamos deducir legítimamente 
una conclusión tal? El problema consiste esencialmente en definir el principio del estado estable 
final, dado que el punto en que éste empieza también marca el término de la transición. 


En nuestra discusión anterior sobre los criterios de estabilidad, vimos que el procedimiento usual 
era adoptar un criterio más estricto de lo necesario. Nos interesaba una identificación 
relativamente inequívoca del estado estable final, sin preocuparnos por el punto en que empezaba 


dicha estabilidad. Vimos, por lo tanto, que la mayoría de criterios de estabilidad desechaban los 
datos que ahora nos interesan, y si estos datos se desechaban, ello era debido a que no estaba 
claro si pertenecían al estado de transición o al estado estable. 


No sólo sería importante hallar una solución a este problema para una mejor comprensión 
general, sino que también tendría consecuencias prácticas ventajosas. Si se pudiera identificar de 
un modo inequívoco el punto final de una transición, el problema del criterio de estabilidad 
desaparecería automáticamente. Ello significaría el ahorro de incontables horas de labor 
experimental que ahora se dedican a hacer cumplir a la conducta con un criterio de estabilidad 
demasiado riguroso. Esto es así debido a que el final de un estado de transición y el principio de un 
estado estable coinciden en el mismo punto. 


Dado que hasta el momento la solución a este problema ni siquiera se ha intentado, podemos 
plantearnos su posibilidad. ¿Será posible, alguna vez, trazar con cierta precisión la línea en que 
termina la transición y comienza la estabilidad? La metodología de que disponemos actualmente 
probablemente nos dé una respuesta negativa. Los procesos conductuales tienen lugar en el 
tiempo y deben observarse, por consiguiente, sobre algún tipo de escala temporal. El concepto de 
estado conductual se utiliza a veces como si fuera algo momentáneo, pero nuestras observaciones 
siempre ocupan, de hecho, un período de tiempo. Se han llevado a cabo intentos de evitar 
enfrentarse a este problema, por ejemplo, montando experimentos que implicaran observaciones 
discretas. Sin embargo, no podemos escapar a las propiedades temporales continuas de un estado 
conductual mediante la selección arbitraria de puntos de observación discretos. 


Los estados de transición y los estados estables constituyen los extremos de un cambio conductual 
continuado, uno de los cuales representa un grado máximo de cambio, mientras que el otro 
representa un grado mínimo. Para medir cualquier cambio deben emplearse, al menos, dos 
observaciones temporalmente separadas. Una vez que dicho cambio haya sido detectado, debe 
llevarse a cabo una observación adicional, como mínimo, para determinar cuándo ha cesado. 
Deben realizarse, pues, un mínimo de tres mediciones para identificar el final de un estado de 
transición. 


En la práctica, lógicamente, se requerirán muchas más de tres mediciones, y uno de los problemas 
fundamentales que surgen al identificar el final de un estado de transición, consistirá en saber con 
qué frecuencia deben llevarse a cabo estas mediciones. Una medición continuada a lo largo del 
tiempo sería lo más deseable, pero las metodologías actuales no están equipadas para ello. 
El registrador acumulativo de Skinner, que permite una inspección visual continuada de un 
proceso conductual, no se presta convenientemente a una evaluación numérica también 
continuada. Incluso si tuviéramos que aplicar algún refinamiento matemático, por ejemplo dentro 
del área del cálculo infinitesimal, deberíamos realizar primero un elevado número de 
observaciones cuantitativas discretas. Estas observaciones deberían ser lo suficientemente 
próximas en el tiempo para que resultaran equivalentes, en la práctica, a una medición 
continuada. Así, cuanto más próximas en el tiempo sean nuestras mediciones, mayor será la 
precisión con que podremos trazar los límites de la transición. Por otra parte, cuanto más 


próximas sean nuestras mediciones, menor será nuestra confianza en haber identificado el punto 
límite real, a menos que ampliemos las mediciones hasta mucho más allá de los límites. Si, por 
ejemplo, la conducta de un sujeto ha estado cambiando uniformemente durante varias horas, y se 
han llevado a cabo mediciones a un ritmo de una por segundo, probablemente no aceptaremos 
una invariación entre dos mediciones sucesivas como indicación de que el cambio ha terminado. 
Nos encontramos, pues, de nuevo, exactamente en el punto de partida. 


Sin embargo, quizás se haya ganado algo, dado que a partir de aquí podemos plantear parte del 
problema con una precisión un poco mayor. Los procesos conductuales tienen lugar en el tiempo, 
y por consiguiente, deben medirse dentro de él. Para identificar los límites exactos de un proceso, 
es necesario efectuar frecuentes mediciones. Sin embargo, a medida que aproximamos nuestras 
observaciones entre sí, nos vemos obligados a utilizar un mayor número de ellas para poder 
identificar los puntos límite. El punto final de una transición se va desdibujando, por lo tanto, a 
medida que hacemos más próximas entre sí nuestras mediciones, pero lo mismo ocurre cuando 
las separamos unas de otras. En el primer caso, nos veremos obligados a tomar en consideración 
un gran número de mediciones y a llevar a cabo algún tipo de evaluación estadística. En el 
segundo caso, toleramos un área de incertidumbre mucho mayor con respecto al punto exacto de 
terminación. 


¿Acaso la evaluación estadística constituye la solución? El problema puede enfocarse como si se 
tratara de la identificación de un punto en que el cambio cesa. Debemos ser capaces de 
comprobar que no hay diferencia alguna entre los valores situados a ambos lados de este punto. 
¿Podremos, pues, evaluar por medio de un análisis de series o de tendencias el punto final de una 
transición de un modo relativamente inequívoco? Ésta es, ciertamente, una posible forma de 
enfocar el problema, pero, por desgracia, la metodología estadística no elimina las dificultades 
básicas. La evaluación estadística debe utilizar siempre, como mínimo, un cierto número de 
valores de la conducta en cuestión, con el fin de permitir un juicio de diferencia no significativa. 
¿Con qué separación mutua deben tomarse los elementos constituyentes de cada muestra? 
¿Qué tamaño deberá tener la muestra, y qué magnitud de cambio podrá tolerarse dentro del 
margen de diferencia no significativa? Las dos últimas cuestiones suelen considerarse, en general, 
solucionables desde el punto de vista de la teoría estadística, pero esto no es cierto. 
Estos problemas son de corte empírico, y una diferencia que resulte significativa en un método 
estadístico particular para evaluar la variabilidad, puede resultar totalmente inconsistente con 
respecto a las manipulaciones experimentales realizadas. Por el contrario, una diferencia 
estadísticamente no significativa puede ser de la mayor importancia en lo que toca a la conducta. 


La evaluación estadística no contiene ninguna inconsistencia que no esté presente también en 
cualquier otro tipo de enfoque normalmente utilizado para resolver este problema. El principal 
factor que sustenta la baja calidad metodológica y la falta de precisión, en la mayor parte de la 
investigación moderna de los estados de transición conductuales, es el fracaso, por parte de los 
propios experimentadores, en resolver los problemas implicados. 


Se da hoy día una curiosa situación. En términos de cantidad de trabajo, en los Estados Unidos, la 
psicología experimental se halla dominada por la investigación de los estados de transición. Los 
experimentos sobre aprendizaje en muchas especies, bajo un gran número de situaciones distintas 
y a menudo sustentadas por una ingeniosa teorización, ocupan la mayoría de las publicaciones, 
todo lo cual se lleva a cabo sin realizar prácticamente ningún intento para solucionar los 
problemas técnicos básicos que acompañan al estudio de las transiciones conductuales. Podría 
constituir un interesante ejercicio histórico averiguar si se han dado situaciones similares en otras 
ciencias, en las que un problema dado haya ocupado la atención experimental y teórica de una 
gran mayoría de científicos, sin haberse hecho siquiera referencia a los problemas técnicos 
pendientes de solución. Los psicólogos se hallan ocupados estudiando el estado de transición 
llamado aprendizaje, sin ser capaces de identificar, con algún grado de precisión razonable, ni el 
principio ni le fin de este proceso. Se enfrentan a la variabilidad tratando a un grupo de sujetos 
como si representara un único sujeto ideal. La reversibilidad es un término que ha sido impuesto 
por científicos interesados en la conducta de estado estable, pero, hasta el momento, sólo ha 
habido un reconocimiento experimental simbólico de este problema. La ilusión de que el 
aprendizaje y otras transiciones conductuales constituyen procesos continuos y un enfoque 
sustentado por una utilización casi exclusiva de promedios de grupo y por un control experimental 
inadecuado, casi nunca se ha puesto en duda, a pesar de que se han llevado a cabo algunas 
demostraciones altamente significativas de que, en general, cabe esperar cambios discontinuos. 


Cuando estas dificultades se atacan con honradez, cabe esperar que el estudio de las transiciones 
conductuales constituirá un empeño científico sólido. La tarea es difícil, y exige el tipo de labor 
experimental concienzuda que debe acompañar a cualquier estudio de un problema inexplorado. 
No se puede imaginar a dónde nos conducirá esta investigación, pero es ciertamente posible 
indicar de qué naturaleza serán los primeros pasos que se den en esta dirección. El primer 
requisito consistirá en adoptar una nueva orientación en el enfoque experimental general. 
El estudiante no podrá formular su problema en términos generales por más tiempo, con lo cual 
quiero decir que no podrá continuar estudiando el aprendizaje o, incluso de un modo más general, 
las transiciones conductuales. Por el contrario, deberá seleccionar, en primer lugar, un caso 
concreto de estado de transición, o incluso un aspecto concreto de este estado, para su estudio 
detallado. En este punto, se verá obligado a investigar la propiedad elegida de la transición como 
un fenómeno intrínsecamente interesante, y no como ejemplo de una clase de fenómenos más 
general. Las generalizaciones llegarán a su debido tiempo, después que las propiedades de varios 
estados de transición individuales hayan sido estudiadas. Empezarán a surgir similitudes, y las 
conexiones con otros fenómenos se harán evidentes al observador despierto. Gradualmente se 
definirá un área de estudio, que quizás reciba el nombre de estados de transición o quizás no. 
Es muy poco probable que la ciencia que de ello resulte se parezca, ni tan cómo remotamente, a lo 
que hoy se conoce como estudio del aprendizaje. 


A fin de que la presente discusión resulte más concreta, permítaseme sugerir un ejemplo 
específico y seguirlo a lo largo de su desarrollo hipotético. En aras de una relativa simplicidad 
escogeré una transición que es reproducible en un organismo individual: el efecto de 


precalentamiento frecuentemente observado en las ratas al principio de cada sesión experimental 
cuando se las somete a un procedimiento de evitación. Este fenómeno se ilustra en la figura 35, 
que representa una sesión de conducta de evitación de siete horas de duración, utilizando una 
sola rata. Para una mejor disposición de las gráficas, se ha cortado el registro en siete fragmentos 
de una hora cada uno aproximadamente, numerados, por orden correlativo, desde el principio al 
fin. La sesión que aparece aquí era la número cinco para este animal. 
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FIGURA 35. Registro acumulativo de la conducta de evitación de una rata obtenida en una sesión 
experimental de siete horas de duración. Los cortos desplazamientos oblicuos indican los shocks, 
hallándose más próximos entre sí al comienzo de la sesión. 


La transición de precalentamiento se ve claramente a simple vista en la densidad de shocks 
relativamente mayor al principio de la sesión. En la primera parte del registro se observa también 
un aumento gradual en la tasa de respuestas. Debemos hallar ahora algún método útil que nos 
permita describir la transición, de modo que podamos pasar a determinar las variables que le 
controlan. Tomemos el principio de la sesión como punto de partida arbitrario y concentrémonos 
en el problema de identificar el final de la transición. 


Tal como he señalado anteriormente, la principal característica de esta transición es la 
disminución de la densidad de shocks a medida que el experimento avanza. ¿Podremos, pues, 
utilizar los shocks para determinar el límite el límite de dicha transición? La inspección visual del 
registro sugiere que la densidad de shocks puede haber alcanzado una relativa estabilidad después 
del shock número cuarenta, indicado por la letra A en la figura 35. Pero, ¿marca este punto el fin 
de la transición? 
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TABLA 2 


Número de shocks 


SESIONES 
HORAS CONSECUTIVAS 1 11 ¡001 
1 40 39 48 
2 12 12 14 
3 8 8 19 
4 a E 6 10 
5 6 7 8 
6 5 14 9 
7 4 8 11 


Podremos hacernos una idea aproximada de los cambios que tienen lugar en la densidad de 
shocks contando el número de ellos que han llegado a administrarse en cada hora sucesiva. 
La Tabla 2 presenta los resultados de este recuento correspondiente a la sesión experimental 
ilustrada en la figura 35 y en las dos sesiones que le siguieron. Resulta evidente, a partir de esta 
tabla, que no puede afirmarse que el final del período de precalentamiento tanga lugar después 
de un número de shocks constante. En las sesiones | y ll, la densidad de shocks se mantuvo 
relativamente constante después que el animal hubiese recibido aproximadamente 50 shocks, 
mientras que en la sesión lll se requirieron 80. De un modo similar, tampoco podemos marcar el 
fin de la transición mediante un período de tiempo constante contado a partir del comienzo de la 
sesión. El tiempo requerido para que la densidad de shocks se estabilice varía considerablemente, 
incluso con la tosca división de la sesión experimental en siete períodos de una hora cada uno. 
Un simple análisis de datos no proporcionará, por lo tanto, uniformidad del tipo que nos permita 
generalizar sobre el punto final de la transición de precalentamiento. 


El paso siguiente consistirá en intentar identificar experimentalmente el punto terminal. A partir 
de aquí, los procedimientos son altamente especulativos, pero servirán para indicar qué tipo de 
investigación es probable que conduzca a una solución del problema. Nadie debería sorprenderse, 
sin embargo, si la respuesta resulta ser una simple desaparición del problema, dado que el método 
de atacarlo es del tipo de los que dan lugar a nuevos datos, y siempre que éstos surjan, debemos 
estar preparados para la posibilidad de que permitan, o incluso fuercen, un nuevo enfoque de los 
problemas antiguos. 


Un método para atacar experimentalmente el fenómeno de precalentamiento consistiría en 
manipular deliberadamente algunas de las variables de las que se sospecha pueden actuar en el 
proceso. Así, por ejemplo, podríamos detener totalmente el experimento durante 15 minutos, 
cada media hora. Ello nos revelaría si el mero factor tiempo de permanencia del sujeto dentro del 
recinto experimental contribuye al precalentamiento. Un resultado posible de este experimento 
se ilustra en la figura 36. En esta figura representamos, en primer lugar, el curso normal del 
precalentamiento tal como se refleja en el número de shocks recibido por el sujeto durante los 


intervalos sucesivos de 15 minutos. La curva de trazo continuo representa estos datos de control, 
obtenidos cuando le procedimiento de evitación fue programado sin interrupciones. 


En la fase experimental desconectaremos el shock durante períodos de 15 minutos alternados con 
períodos de shock, de modo que, aunque el animal continúe respondiendo durante estos períodos 
de shock, no reciba ninguno. Si este procedimiento altera el proceso de precalentamiento, 
sabremos que los shocks, que normalmente se hubiese recibido durante los períodos de 
desconexión del aparato administrador de shocks, son esenciales. 
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FIGURA 36. Datos pertenecientes a un experimento hipotético sobre conducta de evitación. 
La curva de trazo continuo indica el número de shocks recibidos por un animal durante sucesivos 
períodos de 15 minutos a lo largo de una sesión. Los pequeños círculos indican el número de 
shocks recibidos cuando se presentaban períodos alternados de 15 minutos durante los cuales no 
se administraban shocks. La curva de trazos muestra el número de shocks recibidos cuando se 
sacaba al animal del recinto experimental durante períodos alternados de 15 minutos. 


Los datos hipotéticos correspondientes a la segunda fase del experimento se hallan representados 
por los pequeños círculos vacíos de la figura 36. Estos círculos indican el número de shocks 
recibido durante los períodos alternados de 15 minutos. Podemos observar que la disminución en 
la frecuencia de shocks sigue aproximadamente el mismo curso temporal que antes, a pesar de los 
períodos de 15 minutos en que no había ningún shock. Debido a estos períodos, la frecuencia de 
shocks se redujo a la mitad, y, a pesar de ello, el precalentamiento siguió su curso normal. 


De estos datos imaginarios, resultaría que le transcurso del tiempo dentro del recinto 
experimental es un factor decisivo en el proceso de precalentamiento, aunque no se administren 
shocks. 


Para refinar aún más esta observación, podríamos sacar el sujeto del recinto experimental durante 
períodos alternados de 15 minutos, y la curva de trazos de la figura 36 ilustra un posible resultado 
de esta manipulación. Observamos que, cuando el animal es sacado periódicamente del recinto 
experimental se produce una marcada disminución en el precalentamiento. La frecuencia de 
shocks no disminuye ya del mismo modo que lo hacía anteriormente, y junto a la disminución en 
el precalentamiento se observa una pérdida de eficacia en la propia conducta de evitación, tal 
como lo refleja el mayor número de shocks recibidos. 


Los descubrimientos de este tipo serían de gran importancia por sí mismos, y en la mayoría de 
casos se continuarían estudiando por su interés intrínseco. El investigador incluso se olvidaría 
probablemente, al menos de un modo pasajero, del problema original de identificar el punto 
límite de los estados conductuales de transición, y, en su lugar, emprendería la consecución de un 
objetivo más inmediato. De este modo ahondando en las características de este tipo concreto de 
transición, probablemente pondría de manifiesto propiedades desconocidas, o cuya existencia ni 
siquiera se sospechaba, hasta aquel momento. El estudio detallado subsiguiente de otras 
transiciones puede revelar características generalizables que permitan formar un conjunto de 
especificaciones más inclusivo para identificar los límites de los estados de transición. En nuestro 
limitado ejemplo hipotético, el investigador habrá identificado uno de los principales factores que 
controlan el precalentamiento, y tal vez se descubra que otros tipos de transición se hallan bajo un 
control similar. Ello indicaría al experimentador que la transición no debe medirse con respecto a 
la frecuencia de shocks, sino con respecto a alguna otra variable correlacionada con la duración de 
la exposición a la situación experimental. Tal vez un proceso emocional, mediable 
independientemente, será la solución del problema, o quizás sea suficiente contar el número de 
respuestas emitidas por el organismo en la situación experimental, debido a que la consecución de 
la transición simplemente requiera un cierto número de respuestas por parte del sujeto. 


El estudiante se habrá dado cuenta, indudablemente, de que no le he dado la solución al problema 
de identificar el punto límite de una transición conductual. Este problema todavía se encuentra 
más allá de las fronteras de la experimentación, y, simplemente, desconozco la respuesta. Lo que 
he intentado hacer es presentar un método general —no un diseño experimental, sino más bien un 
diseño de experimentación— por medio del cual el estudiante sea capaz de hallar la solución por sí 
mismo. El procedimiento que he sugerido consiste esencialmente en eliminar la variabilidad a 
través del conocimiento y del control de las variables relevantes. De este modo, cuando los 
factores que rigen la aparición y el curso temporal de un estado de transición lleguen a conocerse, 
su punto límite resultará especificable con más precisión. Por regla general, cuando un problema 
aparezca definido tan insuficientemente como el que acabamos de discutir, la raíz de la confusión 
se hallará en la mayoría de casos en una falta de información. Hasta que no se pongan de 
manifiesto las propiedades básicas de un proceso conductual, poco podrá conseguirse intentando 
solucionar cuestiones más sutiles. 


CUANTIFICACIÓN DE LOS ESTADOS DE TRANSICIÓN 


De acuerdo con la larga discusión que antes hemos llevado a cabo sobre las grandes dificultades 
implicadas en la identificación del principio y fin de las transiciones conductuales, el estudiante 
podría considerar completamente gratuito de mi parte enfrascarme en la cuantificación de dichas 
transiciones. Efectivamente, no voy a adentrarme demasiado en este aspecto. Sin embargo, el 
estudio de las transiciones no carece completamente de sentido, incluso con la inadecuada 
metodología de que disponemos actualmente. Con la posible excepción del raro innovador capaz 
de descartar la vieja metodología y empezar de nuevo, la mayor parte de experimentadores que 
se dediquen a este tema tomarán como punto de partida los procedimientos actuales. Además de 
conseguir que el estudiante se familiarice con los procedimientos de medición comúnmente 
empleados, quizás también consiga llamarle la atención sobre algunos procedimientos adicionales 
cuya fecundidad está todavía por comprobar. 


La medida tradicional de una transición es la velocidad, o tasa, del cambio conductual. ¿Cuánto 
tiempo, o cuántas tentativas necesitará un organismo para alcanzar un nivel de conducta 
arbitrariamente determinado? Muchos psicólogos se han dedicado, casi exclusivamente, a 
investigar las curvas de aprendizaje bajo una multitud de condiciones experimentales. Se ha 
proporcionado información sobre curvas de casi todos los tamaños y formas concebibles, y como 
resultado de ello se ha dejado, casi por completo, de hacer referencia al concepto, que en otra 
época prevalecía, de la Curva de Aprendizaje. Los psicólogos califican ahora, modestamente, sus 
curvas de aprendizaje particulares haciendo referencia a las condiciones experimentales bajo las 
cuales aquéllas han sido obtenidas. Existe la posibilidad de que hayamos tomado un camino 
equivocado, y que la rapidez del cambio no sea el aspecto más adecuado de los estados de 
transición, para llevar a cabo una sistematización eficaz. 


De hecho, la única gran generalización que parece factible —y ello nos remite de nuevo a los 
problemas metodológicos—, es la de que cualquier transición conductual no instantánea está 
producida por factores especiales. Es altamente probable que la curvatura de una curva de 
aprendizaje constituya simplemente un reflejo indirecto de la interacción de procesos distintos de 
los que se hallan bajo un control experimental directo. En realidad, en la mayor parte de 
experimentos sobre aprendizaje, el sujeto aprende mucho más de lo que se le enseña. Es decir, 
que se aprenden más cosas de las que el experimentador intenta deliberadamente enseñar. 
Del mismo modo que una curvatura puede ser el resultado de promediar un cierto número de 
curvas discontinuas, obtenidas en un grupo de individuos, puede también derivarse de la 
combinación de varias curvas discontinuas correspondientes a respuestas individuales en un único 
sujeto. 


Así, por ejemplo, podemos preguntarnos qué es lo que se refleja en una curva de adquisición 
correspondiente a la simple respuesta de apretar una palanca que consigue reforzamiento con 


comida. Medimos únicamente las respuestas a la palanca, pero el animal está también 
aprendiendo otras conductas que se reflejan sólo indirectamente en la curva obtenida. El animal 
debe aprender que el gránulo es comestible. Que ha de irlo a buscar en un lugar determinado, que 
sólo aparece después de producirse un ruido característico en el mecanismo administrador de 
comida, que este ruido sólo tiene lugar después de apretar la palanca, que ésta debe hacerse 
descender una distancia mínima y con determinada fuerza, que la palanca se halla situada en un 
punto particular y a una cierta altura en su espacio experimental, etc. Todo ello implica una larga 
cadena conductual y se puede suponer que cada eslabón posee su propia curva de aprendizaje. 
La respuesta de apretar la palanca que medimos sólo constituye un eslabón intermedio de dicha 
cadena, y, por lo tanto, es un reflejo indirecto de todo el aprendizaje que tiene lugar en esta 
situación. Enseñando al sujeto tantos de los demás eslabones como sea posible antes de introducir 
la palanca, la forma de la curva de aprendizaje se aproximará cada vez más a una función 
discontinua (81, páginas 66-74). 


Existen muchos otros ejemplos posibles de este tipo, la mayoría de los cuales no se han explorado 
tan a fondo. Sin embargo, conducen a la prometedora generalización de que siempre que se 
observe una curvatura paulatina en una transición conductual, debemos suponer la existencia de 
procesos incontrolados. El estudio de los estados de transición alcanzará un nivel en el que estos 
procesos podrán ser identificados, y una vez se haya llevado a cabo su identificación, será posible 
eliminarlos, corregirlos o bien estudiarlos deliberadamente. La principal consecuencia de este 
proceso será la de poner al descubierto la transición particular en que uno pueda estar interesado, 
de modo que le sea posible estudiar directamente otras propiedades distintas a su rapidez. 


En el experimento sobre la conducta de apretar la palanca descrito más arriba, la eliminación de 
procesos colaterales implicará un período preliminar de completa adaptación al mecanismo 
administrador de comida; la familiarización con el recinto experimental, a fin de facilitar la 
extinción de la conducta irrelevante; estudios piloto para determinar la colocación más adecuada 
de la palanca, ajustar su sensibilidad, su recorrido y el medio más eficaz de procurar al sujeto 
experimental un feed-back a su conducta; finalmente, será necesario asociar un estímulo efectivo 
al funcionamiento del mecanismo administrador de comida. En realidad, tenemos alguna 
evidencia de que la respuesta concreta de apretar la palanca es demasiado compleja para este 
propósito, dado que la dificultad de su ejecución para un organismo como la rata produce grandes 
variaciones en la topografía de la respuesta. Debido a ello, la ampliación subsiguiente de la clase 
de respuesta que resulta reforzada, aumenta indudablemente la probabilidad de que la curva de 
adquisición sea continua. Es posible que un estudio adecuado de tales curvas requiera la 
utilización de una respuesta más acorde con la dotación biológica del organismo, y 
topográficamente más coherente. 


Otros tipos de respuestas y aparatos comúnmente empleados en los experimentos conductuales 
requerirán una atención similar a los detalles técnicos si se pretende investigar adecuadamente los 
estados de transición. Pero, ¿qué podríamos decir sobre otros tipos de transición distintos a los 
implicados en el aprendizaje de una nueva respuesta? Puede plantearse el problema de si las 
curvas de transición que caracterizan, por ejemplo, el aprendizaje de una discriminación, estás 


sujetas a limitaciones similares. Permítasenos tomar, de nuevo, un ejemplo simple. El sujeto ya ha 
aprendido a apretar la palanca, pero ahora queremos enseñarle a apretarla sólo en presencia de 
una luz. A fin de conseguirlo, disponemos una situación tal que la respuesta de apretar la palanca 
obtenga reforzamiento sólo cuando la luz esté encendida, y nunca sea reforzada cuando esté 
pagada. El resultado habitual en una situación de este tipo es una curva continua de aprendizaje, 
dado que las respuestas emitidas en ausencia de la luz, a pesar de que no obtienen reforzamiento, 
continúan emitiéndose durante algún tiempo a una tasa paulatinamente disminuida. 


Los mismo factores que complicaban el aprendizaje original de la respuesta también están 
presentes aquí, dado que en ausencia de la luz el sujeto ha de desaprender más que la simple 
respuesta de apretar la palanca, por lo que todas las conductas que se condicionaron junto a esta 
respuesta contribuyen a la curva de aprendizaje de discriminación. Por el contrario, si dicho 
aprendizaje de discriminación comienza a la vez que le aprendizaje original de la respuesta, el 
proceso resulta considerablemente acelerado. 


Además de éstos, pueden jugar su baza otros factores. Las respuestas a la palanca que tiene lugar 
inmediatamente antes de que se encienda la luz, resultarán accidentalmente reforzadas. 
La discriminación se establecerá más rápidamente si se hace que estas respuestas propongan el 
estímulo positivo de modo que nunca puedan producirse correlaciones accidentales. También nos 
encontramos con el problema de la generalización de estímulos. Mientras que la presencia y la 
ausencia de la luz se pueden distinguir fácilmente entre sí, todos los demás estímulos presentes en 
la situación son comunes a la vez al estímulo positivo y al negativo. Si el sujeto es colocado en un 
recinto experimental distinto durante la presentación del estímulo negativo, puede conseguirse 
que la discriminación se produzca de forma abrupta, sin una transición gradual. 


Toda la discusión precedente nos lleva a la conclusión de que las mediciones de la velocidad de 
una transición conductual pueden ocultar mucho más de lo que revelan. La descripción más 
adecuada y completa de un estado de transición debe hacerse con respecto a las variables y 
procesos que controlan la conducta bajo esta situación. Los estados de transición graduales 
constituyen fenómenos de segundo orden, y su rapidez debería poderse deducir de observaciones 
más fundamentales. 


Esta conclusión tiene dos consecuencias para el diseño experimental. En primer lugar, si el interés 
primordial del experimentador se centra en la velocidad con que tiene lugar una transición 
conductual, debería esforzarse exclusivamente en refinar sus técnicas experimentales, hasta el 
punto en que los factores que manipula puedan dar lugar a una transición abrupta. A partir de 
este punto, puede pasar a la manipulación de variables, aisladas y combinadas entre sí, y observar 
los cambios que se producen en la curva de referencia. En las dos últimas frases, se condensa una 
vida de trabajo —en realidad, varias vidas—, y tal vez ello explique el por qué nunca se ha llevado a 
cabo. Es éste, sin embargo, un campo abonado, que puede proporcionar muy buenos frutos al 
estudiante que se aventure en él. 


Una segunda consecuencia, en lo que toca al diseño experimental, es la posibilidad de que una 
caracterización más fundamental de las transiciones se lleve a cabo en términos distintos de la 


velocidad con que se produce. Volvamos al efecto de precalentamiento como ejemplo de 
transición, y tratémoslo como un estado cambiante de la conducta. ¿Cuáles son las propiedades 
de este estado cambiante aparte de su velocidad de cambio? Podemos suponer que la conducta 
en cuestión ofrecerá una resistencia a la extinción variable en distintas fases de la transición. 
Para comprobar esta sospecha, podemos simplemente desconectar el mecanismo administrador 
de shocks en distintos puntos del precalentamiento. 


Si descubrimos que existe, de hecho, una relación funcional, podemos ser capaces de valorar la 
transición de precalentamiento por medio de una escala de extinción. A este fin deberemos 
diseñar diversos experimentos para determinar si la escala en cuestión está relacionada, siguiendo 
una regularidad, con otras variables presentes en el proceso. En un estadio más avanzado de 
nuestra experimentación podremos intentar determinar si es posible describir otros tipos de 
transición conductual del mismo modo. Si la resistencia a la extinción no surte efecto, aunque sólo 
sea en parte, nos veremos obligados a empezar de nuevo con otra posibilidad, dado que lo que 
estamos intentando es describir los estados de transición con respecto a su interacción con 
variables cuyo efecto sea el de alterar el curso de dichos estados. 


LAS TRANSICIONES COMO FUNCIÓN DEL ESTADO CONDUCTUAL INMEDIATAMENTE ANTERIOR 


Cualquier conducta se halla, hasta cierto punto, determinada por factores históricos. Las variables 
a las que el organismo ha estado expuesto en el pasado continúan ejerciendo una influencia aún 
mucho tiempo después de que hayan dejado de estar físicamente presentes. Esta consideración 
ha estado presente en gran parte de lo dicho hasta aquí, y resulta de especial importancia en las 
investigaciones experimentales sobre estados de transición, dado que las transiciones 
conductuales está siempre en función, no sólo de las nuevas variables que las producen, sino 
también de las variables que han estado manteniendo la conducta hasta aquel momento. 
Por consiguiente, los estados de transición no pueden estudiarse aislados de su historia. 


Se ha argúido frecuentemente que las técnicas que producen transiciones rápidas no son 
adecuadas para el estudio de procesos tales como la adquisición de una conducta. Así, se sostiene 
a veces que si nuestra situación experimental produce un aprendizaje rápido, estamos frustrando 
nuestro propósito, debido a que no podremos disponer de los procesos relevantes el tiempo 
necesario para estudiarlos, y se supone que sólo cuando la adquisición de una conducta es lenta, 
podremos observar el proceso con detenimiento. Sin embargo, ya he puesto énfasis en el hecho 
de que los estados de transición sólo constituyen casos excepcionales. Y que una transición 
gradual se debe a la acción de factores adicionales que no son, en principio, inherentes a ella. 
Así, pues, las transiciones lentas, lejos de permitir los experimentos de referencia en los cuales 
basar un estudio sistemático, nos imponen la obligación de examinar los factores históricos y del 
momento causantes de su carácter gradual. Ya he hablado, en la sección precedente, acerca de 
algunas variables del momento que influyen en este problema. Ahora debemos preguntarnos qué 
implicaciones especiales conllevan los factores históricos con vistas al diseño experimental. 


La primera implicación se deriva de una observación experimental tan simple como la siguiente: la 
transición conductual que tiene lugar al aumentar la magnitud de un programa de reforzamiento 
de razón fija, por ejemplo, de cinco a cien, está en función del método mediante el cual se hace 
aumentar la razón. Si el número de respuestas requerido por reforzamiento se aumenta 
lentamente, la conducta puede desarrollar un estiramiento —es decir, pausas, más largas de 
postreforzamiento—, aunque se mantendrá bajo la razón de cien. Sin embargo, si la razón se 
aumenta bruscamente desde cinco hasta cien es probable que la transición se produzca en 
dirección opuesta, o sea, que el estiramiento aumente hasta el punto en que la conducta 
desaparezca por completo. 


Por lo tanto, debe proporcionarse al organismo una historia conductual específica para producir 
en él ciertas transiciones. Al pasar de una tasa fija baja a una alta, debe darse a algunas variables la 
oportunidad de afianzarse antes de que la transición se encuentre en condiciones de ser 
estudiada. Es improcedente argúir que la transición es artificiosa simplemente porque las 
manipulaciones son especificables y no resultan más arbitrarias que la administración gradual de 
calor al estudiar el curso de una reacción química. 


Sin embargo, no es suficiente desde un punto de vista sistemático, especificar nuestras 
operaciones experimentales simplemente refiriéndose a ellas como “cambio gradual y cambio 
brusco” en un programa de razón fija. Debemos continuar, pues, preguntándonos de qué modo 
dichas operaciones alteran la relación entre la conducta y las variables que la controlan de un 
modo inmediato. ¿Qué le ha sucedido a la conducta, como consecuencia del cambio gradual en la 
razón, que le permita continuar manteniéndose bajo un requerimiento de razón tan alto? 
¿Acaso nuestra operación ha posibilitado que la “cuenta” de respuestas se convierta en un 
refuerzo condicionado? Estas posibilidades han sido discutidas adecuadamente por otros 
autores, y no hay necesidad de profundizar en ellas aquí. El punto importante al que nos ha 
conducido nuestra discusión es que resulta probable que los factores históricos sean relevantes, 
debido, no a ningún tipo de acción ejercida a distancia temporal, sino a algún residuo de su efecto 
que se mantiene por sí mismo hasta el presente. Una deficiencia dietética producida por beber 
excesivamente, puede tener como consecuencia una lesión hepática que será irreversible aun 
después de que se haya renunciado por completo a la bebida. De modo similar, una historia 
conductual particular puede cambiar la relación entre la conducta y las variables que la controlan, 
de modo que la nueva relación persista aún después de que las condiciones que la originaron 
hayan desaparecido. 


Hemos visto, pues, dos implicaciones relacionadas de los factores históricos para el estudio de los 
estados de transición: a) Una transición puede requerir una manipulación experimental deliberada 
con el fin de establecer una historia de control determinada que la haga posible, y b) la 
comprensión cabal de los “procesos implicados en una transición puede requerir la investigación 
de los nexos de unión entre las variables del momento y las históricas. 


Las consideraciones que acabo de hacer nos conducen de nuevo a la conclusión que ya he 
enunciado antes, pero que vale la pena repetir. Un estudio adecuado de los estados de transición 


requiere un conocimiento de la historia conductual, de la inmediata, por descontado, y 
probablemente también de la más remota. No existe ningún factor que pueda identificarse con 
una ausencia de historia conductual, y pasarlo por alto no es un substituto de su correcta 
especificación. La mejor forma en que un investigador puede especificar la historia conductual de 
un organismo, en la medida que sea relevante a un problema dado, es proporcionando dicha 
historia al organismo de un modo deliberado. Lógicamente historias distintas ejercerán efectos 
diferentes sobre los estados de transición subsiguientes, pero ello constituye una característica de 
la conducta, y no algo de lo que podamos intentar escapar. La falta de información sistemática que 
describa las transiciones en función de la historia conductual, constituye una importante laguna en 
los datos de la psicología experimental y, concretamente, en el área del aprendizaje. 
La especificación del estado de conducta anterior a una transición constituye, por consiguiente, 
tanto un problema metodológico en un experimento particular como un problema general que 
merece estudiarse por su propio interés. 


Desde un punto de vista metodológico, existe un interesante problema que debe afrontarse 
inevitablemente. Una transición conductual puede estudiarse a medida que se desarrolla desde un 
estado estable precedente, o bien a medida que emerge de otra transición inacabada. La segunda 
alternativa ha recibido todavía menos atención experimental que la primera, y, sin embargo, 
resulta más prometedora con vistas a revelar las propiedades de los estados de transición. 
Este método implicaría un cambio en los factores experimentales mientras que la conducta se 
halla todavía en transición desde un estado estable a otro. Este procedimiento puede llevar a 
engaño, dado que incluye todas las incertidumbres de medición y control que acompañan a las 
técnicas actuales para estudiar las transiciones conductuales. Nos encontramos, pues, no sólo ante 
el problema de identificar el principio y el fin de la primera transición, sino también de especificar 
los estadios intermedios de modo que permitan una replicación significativa. Así, pues, se nos ha 
doblado el problema de cómo caracterizar una transición, dado que estamos tratando con dos 
transiciones de un modo casi simultáneo. 


A pesar de estas dificultades, merece la pena intentarlo, dado que, aunque quizá se nos doble el 
problema, el beneficio potencial puede ser mucho mayor. Así, si descubrimos que una segunda 
transición varía en función del estado en que se halla una transición previa de la cual se ha 
originado, habremos obtenido una valiosa información sobre ambos estados de transición. Este es 
el tipo de conocimiento que, probablemente, hará cambiar algunas de nuestras nociones 
tradicionales sobre los estados de transición, debido a que los describe con respecto a sus 
relaciones recíprocas, y pone un énfasis especial en aquellas propiedades de una transición que se 
derivan y se extienden de un aspecto a otro de la conducta de un organismo. 


Además de las implicaciones que esta técnica tiene para los diseños experimentales originales, sus 
mismas dificultades constituyen, al mismo tiempo, una señal de precaución para aquellos 
investigadores que prefieran utilizar otros enfoques experimentales en el estudio de los estados 
de transición. A menos que un experimento se diseñe deliberadamente para examinar las 
transiciones a medida que se desarrollan de un línea de base formada por otras transiciones, 
resultaría fatal permitir que esta complicación se nos introdujera inadvertidamente en el 


experimento en cuestión. Un estado estable es la única alternativa a una línea de base de 
transición, de modo que, si no se desea tomar un estado de transición como línea de case, a partir 
de la cual iniciar una segunda transición, el experimentador debe tomar todas las precauciones 
posibles para asegurar que su conducta de línea de base se mantenga en estado estable. Si este 
control se pasa por alto, probablemente los datos resultantes no serán replicables. 


Para tomar un ejemplo simple, supongamos que deseamos examinar el estado de transición que 
tiene lugar al pasar de un procedimiento de evitación discriminado a otro no discriminado. En una 
evitación discriminada, el sujeto pospone un shock durante 20 segundos, por ejemplo, cada vez 
que aprieta una palanca. Además, aparece una señal de advertencia cinco segundos antes de que 
vaya a administrarse un shock si el sujeto no ha emitido ninguna respuesta a la palanca que 
posponga esta señal. Se ha descubierto mediante este procedimiento que la rata blanca suele 
esperar a que aparezca el estímulo de advertencia antes de apretar la palanca, emitiendo muy 
pocas respuestas en todos los demás períodos del experimento. Siguiendo el desarrollo de esta 
conducta de “espera”, supongamos que desconectamos el estímulo de advertencia, sin variar 
ningún otro aspecto del procedimiento, y nos fijamos en el curso del cambio conductual que tiene 
lugar después de haberse eliminado la señal. 


En un experimento de este tipo se observó que la eliminación del estímulo de advertencia produjo 
un aumento en la tasa de respuestas de evitación. Los animales ya no esperaban que el shock 
fuera inminente para apretar la palanca, sino que respondían con una frecuencia mucho mayor 
que la necesaria. La evaluación de este aumento en la tasa pudo seguirse claramente sobre un 
registro acumulativo de respuestas. A pesar de que se había retirado el estímulo, los animales 
continuaban comportándose como si todavía formara parte del procedimiento. Se abstenían de 
apretar la palanca hasta que faltaban cinco o menos segundos para que se administrara el 
próximo shock, comportándose exactamente del mismo modo que lo habían hecho cuando la 
presencia de una señal marcaba el comienzo del período de cinco segundos. ”* 


La experimentación subsiguiente demostró que la diferencia entre los resultados obtenidos se 
podría explicar a partir del estado de la línea de base. Al exponer los sujetos durante un largo 
período al procedimiento de línea de base de evitación discriminada, se desarrollaba un control 
temporal sobre la conducta, con lo que la señal pasaba a ser superflua. Los animales respondían 
en el momento apropiado, pero sin utilizar ya nuestro estímulo de advertencia como señal, debido 
a que habían desarrollado alguna otra técnica para medir el tiempo. No es de extrañar, pues, que 
su conducta no cambiara al eliminar el estímulo de advertencia. 


Nos hallamos, pues, ante un ejemplo extremo de las dificultades que pueden bloquear la 
replicación cuando la conducta de línea de base no ha alcanzado un estado estable, sino que se 
encuentra todavía en una transición. Aquellos animales cuya conducta de línea de base se hallaba 
aún bajo la transición del control de un estímulo a un control temporal, mostraron un cambio en la 
conducta cuando retiramos la señal de advertencia. Sin embargo, esta operación no produjo 
cambio alguno en los animales que habían completado la transición desde el estímulo al control 
temporal. 


Vale decir que esta transición desde el control por un estímulo al control temporal, que tenía lugar 
en un procedimiento de evitación discriminada, ni siquiera se había sospechado hasta que se 
introdujo un cambio en las condiciones experimentales. Nuestro ejemplo cumple, pues, con una 
segunda función al ilustrar cómo algunos aspectos de una transición —incluso su misma existencia— 
pueden ser puestos de manifiesto solamente a través de sus relaciones con otros aspectos de la 
conducta. 


RECUPERACIÓN DE LOS ESTADOS DE TRANSICIÓN 


Una historia conductual puede continuar ejerciendo control aun después de que se haya 
introducido un conjunto distinto de variables. Debido a ello, las características de un estado de 
transición pueden cambiar sistemáticamente con cada repetición del experimento utilizando un 
único sujeto. Cabe preguntarnos, pues, si es posible llevar a cabo la replicación intrasujeto de una 
transición bajo estas condiciones. 


Antes de renunciar a la replicación intrasujeto, en casos en que la historia sea importante, 
deberíamos plantearnos la cuestión que ya he mencionado anteriormente: “¿Qué aspectos de la 
transición nos interesan?” Si nos damos por satisfechos con el estudio de su velocidad, quizá 
concluyamos que una observación original determinada no será recuperable. Sin embargo, si nos 
interesan los procesos conductuales implicados en una transición, quizás podamos llevar a cabo 
una replicación individual sistemática aun en el caso de que la velocidad de la transición cambie 
con cada repetición sucesiva. 


Tomemos como modelo, por ejemplo, una transición descrita con gran detalle experimental por 
Ferster y Skinner. Su reseña de la evolución sufrida por la conducta que sigue a un cambio desde 
un reforzamiento continuo a un programa de intervalo fijo, constituye una descripción clásica de 
una transición conductual. Tomemos la figura 37 como nuestra curva de referencia, mediante la 
cual podemos hacer resaltar las características importantes del análisis. Al describir la transición, 
he parafraseado el texto de Ferster y Skinner. 


1. Cuando empieza el programa de intervalo fijo, el reforzamiento continuo precedente produce, en primer 
lugar, una curva de extinción negativamente acelerada, tal como muestra el primer segmento b y la curva de 
trazos en a. la tasa suele alcanzar un bajo nivel, tal como ocurre en c, considerablemente menor que la tasa 
que a la larga se mantendrá bajo el programa de reforzamiento de intervalo fijo. Cada reforzamiento, indicado 
por las líneas verticales de trazo continuo, va seguido por un aumento en la tasa, y el intervalo suele 
caracterizarse por un pequeño segmento negativamente acelerado. La marcada aceleración negativa, 
atribuida a la extinción, se halla combinada con estas curvas más pequeñas. 

2. Se produce una tasa de respuestas relativamente uniforme, en el transcurso de un intervalo, así como de un 
intervalo a otro, tal como sucede en e. esta tasa constante parece desarrollarse independientemente del 
tamaño del intervalo, y es de suponer que se deba a la especial probabilidad de reforzamiento que existe en 
las tasas bajas, derivadas de las contingencias que han prevalecido hasta aquel momento. La alta tasa de 
respuestas que se observa al principio, en los segmentos marcados con una b, está en correlación con la 
ausencia de reforzamiento, mientras que la tasa baja que tiene lugar hacia el final de estos segmentos 
constituye un estímulo favorable. Los segmentos de intervalo fijo negativamente acelerados dan lugar, por lo 
tanto, a tasas bajas, y la relación entre estas tasas bajas y el reforzamiento, es la diferencia más importante 


entre las transiciones que tienen lugar desde un programa de reforzamiento continuo a un programa de razón 
fija, por un lado, y de intervalo fijo, por el otro. 

3. Debido a la uniformidad de la tasa que se produce, el número de respuestas por reforzamiento se vuelve 
marcadamente constante. Se observa que este factor da lugar a breves “rachas” de respuestas emitidas a una 
tasa más alta, tal como aparece en f. no se ha observado hasta este punto ningún caso de tasas tan altas, ni, 
desde luego, dichas tasas han sido nunca reforzadas. Las breves “rachas” resultan, pues, ocasionadas por e 
reforzamiento automático debido a la aproximación al número de respuestas que prevalece de un modo 
característico en el reforzamiento. Estas “rachas” destruyen la constancia de este número, debido a lo cual la 
situación es inestable. 

4. Enel último estudio de la transición, que no aparece en la figura 37, se producen pausas después de los 
reforzamientos, que a su vez van seguidas por una aceleración uniforme hasta llegar a la tasa terminal, tasa 
que se mantiene hasta el próximo reforzamiento (ver la figura 18) (34, páginas 135 y siguiente). 
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FIGURA 37. Curva suavizada correspondiente a la transición de un programa de reforzamiento 
continuo a otro de intervalo fijo. (De Ferster y Skinner, 34, p. 135.) 


Esta descripción de una transición conductual, que sólo constituye una pequeña porción del relato 
completo, es notable por su falta de énfasis en la velocidad con que transcurre la transición. 
Este informe podría haberse presentado en la forma tradicional de curvas de aprendizaje, pero 
ello sólo hubiera servido para oscurecer la riqueza y complejidad del proceso. A la vez, habría 
imposibilitado la replicación intrasujeto. 


Por el contrario, Ferster y Skinner llevaron a cabo un gran número de replicaciones intrasujeto. 
Prestando atención, desde un punto de vista analítico y experimental, a los múltiples procesos 
implicados en la transición de intervalo fijo, no sólo fueron capaces de llevar a cabo replicaciones 
sistemáticas de sus observaciones iniciales sino que, además, fueron capaces de esclarecer 
notablemente las variables que controlan los distintos aspectos de la transición. Mediante 
manipulaciones tales como el paso de un intervalo fijo corto a uno largo y viceversa, la 
programación de un time-out inmediatamente después de cada reforzamiento, tanto en los 
intervalos cortos como largo, la inserción de un time-out como sonda durante el intervalo, la 
adición de relojes y contadores exteroceptivos, así como la inclusión de otros programas en 


tándem con el de intervalo fijo, fueron capaces de hacer resaltar o de eliminar selectivamente los 
distintos aspectos de la transición. El control experimental conseguido de este modo permitirá a 
cualquier experimentador que esté interesado en ello generar una transición de un programa de 
reforzamiento continuo a otro de intervalo fijo, de modo que prácticamente le resulte tan rápido o 
tan lento como le interese. 


Sin embargo, con la información que Ferster y Skinner han aportado, la rapidez de la transición se 
ha convertido en una característica superflua. Por lo tanto, el hecho de que un experimentador se 
desilusione a estas alturas debido a la dificultad de replicar la velocidad de transición, implica que 
su interés en la conducta es, de un modo parecido, solamente superflua. Los procesos implicados 
en la transición pueden colocarse bajo control experimental y replicarse en sujetos individuales. 


Desgraciadamente, hay demasiado pocos ejemplos similares para ser citados. El estudiante 
debería considerar este hecho, no como un obstáculo sino como un desafío. La tarea de analizar 
los componentes de las transiciones conductuales resultará fructífera, tanto en los que respecta a 
la obtención de nuevos datos como al avance técnico realizado. 


Un caso interesante en el que la repetición da lugar a una transición progresivamente más rápida, 
es el fenómeno que a veces se denomina “pauta de aprendizaje” o “aprender a aprender”, 
extensamente investigado por Harlow y sus colaboradores. El resumen del experimento publicado 
por Harlow es el siguiente: 


[Ocho monos Rhesus fueron adiestrados] en una serie de 344 problemas de discriminación de objetos, 
utilizando un par de estímulos distintos en cada discriminación. Cada uno de los primeros 32 problemas se 
componía de 50 pruebas, los siguientes 200 problemas, de 6, y los últimos 112 problemas, de un promedio 
de 9 pruebas cada uno. Las curvas de aprendizaje que muestran los porcentajes de respuestas correctas se 
hallan representadas en la figura 38. Estos datos demuestran que la capacidad de los animales para resolver 
problemas de discriminación mejoraba progresivamente. Los monos aprendieron gradualmente cómo 
resolver problemas individuales con un mínimo número de errores, proceso que se designa con el término 
pauta de aprendizaje. Los animales adquirieron tal maestría que si escogían el objeto correcto en la primera 
prueba, rara vez cometían un error en las subsiguientes. Si, por el contrario, escogían el objeto incorrecto en 
la primera prueba, inmediatamente pasaban al objeto correcto y de ahí en adelante respondían casi a la 
perfección (40, página 200). 


El aumento en la pendiente inicial de las curvas de aprendizaje correspondientes a grupos de 
problemas sucesivos, proporciona una indicación de que se producen transiciones 
progresivamente más rápidas. Muchos investigadores han aceptado esta transición cambiante 
como su característica distintiva, y la han empleado para medir diferencias entre especies. Harlow 
escribe: “La rigidez de los hábitos fijos y relativamente invariables tan característica de algunos 
animales más inferiores, se troca en la plasticidad de conducta y la capacidad para pasar de una a 
otra pauta de aprendizaje que son típicas de los primates” (40, página 208). 


Sin embargo, otros investigadores se han orientado hacia la exploración de la naturaleza de los 
cambios en el control conductual que no son responsables de que las transiciones se produzcan 
más rápidamente. El mismo Harlow señaló que: “La única clave de los cambios de pauta 


problemáticos fue el fracaso en recompensar una respuesta correcta previa” (40, página 207). 
Otros investigadores han estudiado este fenómeno más básico, denominado en ocasiones 
“discriminación de extinción”. Al tratar de demostrar dicho fenómeno, incluso en un organismo 
tan inferior como la rata blanca, han logrado esclarecer el proceso mediante el cual el no 
reforzamiento de la conducta adquiere un control discriminativo, así como suscitar nuevo 
problemas acerca de la naturaleza de este control. 
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FIGURA 38. Curvas de aprendizaje de discriminación correspondientes a grupos sucesivos de 
problemas. (De Harlow, 40, p. 201.) 


El diseño básico de estos experimentos ha consistido en reforzar y extinguir alternativamente, sin 
más indicio exteroceptivo correlacionado con el principio de la extinción que la retirada del 
reforzamiento con comida. La transición cambiante se refleja en un número decreciente de 
respuestas emitidas en los períodos de extinción sucesivos.?” % Cuando la conducta sólo es 
reforzada de un modo intermitente, se retarda la disminución de las respuestas de modo 
intermitente, se retarda la disminución de las respuestas de extinción,” lo cual era de esperar si la 
transición se hallaba bajo control de estímulos asociados con la omisión del reforzamiento. 


Por otra parte, se ha observado que se produce en la transición un cambio progresivo similar 
cuando una conducta de evitación se shocks se condiciona y extingue alternativamente.?? 
¿Cómo llega un organismo a discriminar el hecho de que un shock ha dejado de amenazarle 
cuando no hay ningún cambio externo que así lo indique? Existen todavía, en este campo, muchos 
problemas por resolver, problemas que nos plantean las observaciones de pautas de aprendizaje, 
pero no nos los solucionan. Nuestra comprensión de las pautas de aprendizaje dependerá de las 


investigaciones funcionales de las variables que las controlan. El uso prematuro de esta técnica 
aplicada al estudio comparativo de diversos aspectos de la conducta, sólo puede llevarnos a 
generalizaciones engañosas sobre las diferencias conductuales que presentan los organismos. 


Por lo tanto, los cambios sistemáticos que nos impiden replicar en un solo sujeto la velocidad con 
que transcurre una transición inicial, pueden atribuirse a cambios correspondientes en las 
relaciones entre la conducta y una o más de las variables que la controlan. Cuando tales cambios 
se interfieren con el estudio de un estado de transición, debe alterarse el diseño experimental a 
fin de revelar la naturaleza de estas relaciones. La información obtenida de este modo, o bien nos 
permitirá volver al problema original con un grado de control experimental más efectivo, o bien 
revelará la debilidad del enunciado original del problema, lo cual dará lugar a una nueva 
interpretación del mismo. 


¿CUÁNDO DEBEMOS INICIAR UNA TRANSICIÓN? 


En general, la conducta de un sujeto se coloca bajo control experimental durante un período de 
tiempo discreto y limitado. En los informes experimentales, es frecuente encontrar gráficas en las 
que se representa alguna medida de la conducta en función de “días”, “horas”, “pruebas”, 
“sesiones”, etc. Los que estén familiarizados con la metodología típicamente usada, se darán 
cuenta de que los días, pruebas, horas, sesiones, etc., no suelen representar períodos de tiempo 
continuados, sino que, en general, hay períodos intermedios en los que se ha sacado el sujeto del 
ambiente experimental, y durante los cuales su conducta no se ha manipulado ni observado. 
Los animales inferiores son devueltos a sus jaulas durante estos períodos intermedios; los 
estudiantes de primer año son devueltos al mundo exterior, y el recluta militar regresa a su rutina. 


Probablemente, los períodos de observación discretos se han convertido en una constante en los 
experimentos conductuales, debido a los problemas prácticos que de otro modo surgirían al llevar 
a cabo una programación, un registro y un análisis continuado de los datos. Estos problemas son 
reales, a pesar de que se están desarrollando métodos para solucionarlos. En este momento, sólo 
deseo considerar la influencia que han tenido los tradicionales períodos de observación discretos 
sobre el punto en que solemos iniciar las transiciones conductuales. 


En general, se da comienzo a dichas transiciones alterando las variables que controlan la conducta 
inmediatamente después del principio del período de observación. Esta práctica probablemente 
tenga su origen en dos fuentes. Una de ellas es la aceptación de la variabilidad entre sujetos y, por 
consiguiente, el uso de datos agrupados. Los experimentadores se han mostrado reacios a cambiar 
las condiciones experimentales en algún punto fijado, después que la conducta estudiada haya 
estado emitiéndose por algún tiempo, debido a que no todos los sujetos del grupo habrán 
alcanzado el mismo estado conductual. La segunda consideración que se opone a los cambios 
dentro del período de observación ha sido la dificultad relativa de alterar el equipo de 
programación con la suficiente rapidez para no perturbar la conducta que en aquel momento se 
está desarrollando. 


A pesar de que en años recientes se han desarrollado técnicas de control adecuadas para ser 
usadas con sujetos individuales, y de aparatos de programación que permitan producir cambios 
automáticos y casi instantáneos en las condiciones experimentales, la práctica de introducir estos 
cambios al principio de un período experimental es todavía la que prevalece. Creo que ello se 
debe, principalmente, a la simple inercia. El control y las técnicas de programación avanzadas se 
desarrollaron para conseguir objetivos distintos al estudio de los estados de transición, y sólo unos 
pocos investigadores, que emplean estas técnicas, se han dado cuenta de esta posible aplicación. 


¿Cuáles son los pros y los contras para iniciar una transición conductual al principio de una sesión 
experimental, por una parte, y una vez empezadas, por otra? A pesar de haber empleado el primer 
método en mi trabajo de modo casi exclusivo, no encuentro mucho que decir a su favor. 
Las transiciones conductuales producidas por el cambio de una variable de control al principio de 
una sesión se hallan contaminadas por la conducta incontrolada, y en general no observada, que 
se ha estado produciendo inmediatamente antes de que empiece dicha sesión. 


Hay, además, la pérdida de control experimental que suele producirse durante los períodos entre 
sesiones, una pérdida que se manifiesta en los distintos fenómenos de precalentamiento y acerca 
de la cual se sabe poco. Estos problemas pueden evitarse demorando el comienzo de la transición 
hasta que la conducta se ha estado emitiendo por algún tiempo. De este modo, se dispondrá de 
una línea de base especificable e inmediata, a partir de la cual será posible medir los cambios 
conductuales que se produzcan. Todavía tiene más importancia el hecho de que, al mostrar 
propiedades conocidas y características, la línea de base demostrará si la conducta se halla 
realmente bajo el control de los factores experimentales del momento. 


Aquí hay, pues, una oportunidad para el experimentador bisoño de realizar un avance 
considerable sobre el trabajo de muchos de sus predecesores. Si está interesado en estudiar las 
transiciones de un estado estable a otro, podrá conseguir una información más útil y más fiable 
diseñando sus experimentos de modo que las transiciones comiencen sólo después de que la 
conducta de línea de base haya sumido la estabilidad dentro de una sesión experimental. Incluso 
el investigador, cuyo interés principal gire alrededor del estado estable final, sacará provecho de 
seguir esta regla de diseño experimental, dado que probablemente obtendrá con ello una 
información útil tanto sobre las transiciones como acerca de los estados estables límites. 
Una información de este tipo, a pesar de que se obtiene tan fácilmente, ha resultado 
extremadamente rara hasta el presente 


ESTADOS TRANSITORIOS 


Los estados de transición también pueden considerarse estados transitorios, dado que los cambios 
conductuales que implican cesan, más tarde o más temprano, al alcanzar algún tipo de estado 
estable. Existe, sin embargo, otra clase de estados transitorios que resulta muy útil considerar 
aparte de las transiciones, aunque los dos pueden tener lugar conjuntamente. Una transición 
implica un cambio de un estado de conducta a otro, mientras que la consecución de una fase 


transitoria se define por el retorno a la misma conducta que se habría observado si el efecto 
transitorio no hubiese llegado a producirse. La figura 39 ilustra la diferencia. En la curva l, la fase B 
constituye una transición entre un estado estable, A, y un nuevo estado estable, C. en la curva ll, la 
fase B representa un estado transitorio seguido por un retorno al estado estable A. 
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FIGURA 39. Ilustración de un estado de transición y de un estado transitorio. 


En el estudio de los estados transitorios, nos encontramos con todas las dificultades que he 
mencionado al hablar de las transiciones conductuales. Las fases transitorias, sin embargo, 
conllevan algunos problemas adicionales. Una fuente de complicación es el hecho de que los 
cambios transitorios suelen ocurrir de un modo aparentemente espontáneo en la conducta. 
Es decir, que pueden presentarse aun cuando el experimentador no haya manipulado ninguno de 
los factores experimentales. Estos casos pueden imputarse con frecuencia a la historia conductual 
del sujeto o a las interacciones que tienen lugar entre la conducta en curso y las variables que la 
están controlando, o bien a ambas cosas a la vez. 


Un ejemplo en que una historia conductual particular puede interactuar con las variables que 
actúan en aquel momento, para producir cambios transitorios, lo proporciona un sujeto animal 
cuyo programa de reforzamiento ha sido cambiado de FR (razón fija) a DRL (reforzamiento 
diferencial de tasas bajas). El programa de razón requiere un número fijo de respuestas por cada 
reforzamiento, y genera una tasa de respuestas alta. El programa de DRL subsiguiente requiere, 
por otra parte, que el sujeto distancíe sus respuestas al menos 20 segundos una de otra, para 
conseguir el reforzamiento. A pesar de que el programa de DRL genera a la larga su tasa de 
respuesta característicamente baja y estable, se dan casos en que el antiguo programa de razón 
“irrumpe” en aquél. Dicho en otras palabras, las fases transitorias de tasas altas características del 
programa de razón anterior interrumpen la uniforme conducta de DRL. El origen histórico de estos 
períodos transitorios de altas tasas de respuesta es claro, y sirve para recordarnos que la historia 


del sujeto debe tenerse en consideración al planear un experimento y al interpretar sus datos. 
Sin embargo, hay más cosas que aprender de este ejemplo. Una historia dada no ejerce sus 
efectos en un vacío conductual, tal como resulta evidente cuando nos preguntamos por qué los 
cambios transitorios tienen lugar en determinados momentos. 


La respuesta a esta pregunta, en nuestro ejemplo concreto, requiere cierta familiaridad con 
algunas de las características detalladas del esparcimiento de respuestas tal como es generado por 
el programa de DRL. Diseminadas entre las respuestas uniformemente espaciadas, observamos 
con frecuencia pequeñas ráfagas de respuestas rápidas. En un organismo sin una historia de razón 
fija, el tamaño de estas ráfagas permanece pequeño, pero para el sujeto que ha tenido experiencia 
con programas de razón, una rápida ráfaga de respuestas restablece una de las condiciones que 
habían prevalecido inmediatamente antes del reforzamiento bajo el programa de razón. 
Las respuestas rápidas generan a su vez más respuestas rápidas, con lo que surge, de la pequeña 
ráfaga inicial, una conducta parecida a la conducta de razón. Esta conducta cesa a la larga debido a 
que no obtiene reforzamiento, y la pausa subsiguiente restablece la baja tasa del programa de 
DRL. 


Las fases transitorias, pues, no implican espontaneidad o arbitrariedad en la conducta, a pesar de 
que pueden producirse en ausencia de manipulaciones experimentales deliberadas. Con el fin de 
eliminar estos cambios transitorios, será necesario identificar los factores que los determinan, 
dado que el control experimental nos dará los únicos métodos eficaces para evitarlos. 


Si se desea estudiar deliberadamente un estado transitorio particular, en lugar de eliminarlo, surge 
un problema importante: el carácter normalmente fugaz de los estados transitorios. Si un 
fenómeno conductual se desvanece rápidamente resultará extraordinariamente difícil examinarlo 
con detalle. Cuando tenemos la complicación adicional de la “espontaneidad” y debemos esperar 
la aparición de la fase transitoria sin poderla producir a voluntad, los problemas se multiplican. 
No debemos sorprendernos que, como clase de procesos conductuales, los fenómenos 
transitorios hayan sido los investigados con menor frecuencia y adecuación. 


En la investigación de un estado transitorio, la simple observación de su aparición constituye un 
primer paso necesario, aunque las primeras observaciones que de él se realizan no suelen ser el 
resultado de un experimento deliberadamente diseñado con este propósito. Los estados 
transitorios se observan con frecuencia conjuntamente con los procedimientos experimentales 
diseñados con otro objetivo. Una clase bien conocida de estados transitorios incluye los cambios 
de conducta temporales que, a menudo, tiene lugar cuando un procedimiento experimental se 
altera por primera vez, o bien cuando un nuevo estímulo u otra variable son introducidos, 
igualmente, por primera vez. Una exposición inicial de un organismo a un shock eléctrico, por 
ejemplo, puede producir profundos cambios conductuales que no se volverán a observar en dicho 
organismo. Este tipo de fenómenos transitorios a menudo se denominan “emocionales”, debido 
tanto a sus manifestaciones ampliamente generalizadas, como a la adaptación que se produce. 
Efectos transitorios similares pueden ser generados por la presentación de nuevos estímulos. 


La clasificación de estos efectos como emocionales no nos ayuda a controlarlos 
experimentalmente. La duración y magnitud de los cambios constituyen, sin embargo, 
importantes propiedades que deben determinarse en las observaciones iniciales. Antes de que 
resulte posible poner en práctica un estricto control experimental, se requerirán estudios 
adicionales encaminados a establecer las propiedades relevantes de los factores que dan lugar al 
estado transitorio, ya pertenezcan a la historia conductual, a la conducta en curso, etc. Cuando 
esta información se haya obtenido, podremos permitirnos hacer algunas conjeturas 
fundamentales sobre otros estados transitorios en que los factores que los producen no son tan 
fácilmente observables. 


Así, por ejemplo, se observan a menudo aumentos transitorios en la tasa de respuesta, en 
experimentos de evitación, cuando la respuesta del sujeto pone fin a un estímulo de advertencia. 
Esta observación induce a sospechar que existe un proceso similar en aquellos casos en que se 
produce un aumento transitorio en la tasa, aparentemente espontáneo, cuando no hay 
eliminación de ningún estímulo de advertencia exteroperceptivo. (Ver los puntos marcados A y B 
de la figura 17, capítulo 5). Tal vez, en estos casos, el estímulo de advertencia lo proporciona la 
misma conducta del organismo. Esta posibilidad podría comprobarse convirtiendo 
deliberadamente algún aspecto de la conducta que se está emitiendo en un estímulo que sirviera 
de señal de advertencia. Si el aspecto relevante de la conducta se coloca bajo el control de un 
estímulo, podremos conseguir un preparado conductual que permita la investigación intensiva de 
los cambios transitorios que se producen. 


Un cambio transitorio puede tener lugar, a veces, debido a contingencias accidentales que se 
establecen entre un estímulo reforzador y algún aspecto de la conducta. Estos cambios se 
observan, a menudo, durante la adquisición inicial de una respuesta. Si se requiere de un animal 
hambriento que apriete un pedal para obtener comida, quizás la primera respuesta eficaz sobre el 
pedal se consiga cuando el animal se tienda por casualidad sobre él. A continuación, el animal 
puede emitir respuestas similares del mismo tipo, pero en un lugar inadecuado, por la que no 
obtendrá comida. El siguiente reforzamiento tal vez ocurra cuando el animal caiga 
accidentalmente sobre el pedal al pegar un salto hacia el techo del recinto. Debido a ello, tal vez se 
observe después un estadio transitorio caracterizado por la conducta de saltar. Estos estados 
transitorios, cuando tienen lugar antes del desarrollo de una conducta relativamente eficaz y 
estereotipada, suelen denominarse conducta de “ensayo-y-error”. Hay investigadores que nunca 
van más allá de estas observaciones iniciales, y califican la conducta de ensayo -y-error de proceso 
de aprendizaje básico, sin dedicar ulterior atención a las fases transitorias. 


Estos aspectos transitorios de la conducta parecen escapar completamente del control 
experimental, dado que se producen dentro de situaciones experimentales en que se supone que 
todos los factores permanecen constantes. Los estadios transitorios tienen lugar con frecuencia y 
pautas que varían marcadamente de un sujeto a otro. ¿Cómo pueden llegarse a controlar 
experimentalmente fenómenos tan variables y pasajeros? Tampoco dispongo esta vez de ninguna 
solución definitiva al problema. El diseño experimental deberá orientarse hacia las cuestiones 
específicas planteadas, y no estoy seguro de que nadie haya formulado todavía las preguntas 


adecuadas sobre los estados transitorios. En el caso de los cambios transitorios que se producen 
dentro de un marco ambiental constante, sería provechoso buscar contingencias accidentales 
surgidas de variaciones en la conducta. Estas contingencias podrían luego reproducirse 
experimentalmente, manipulando las variables cuya relevancia se sospecha. Una información 
adicional de este tipo permitirá a la larga un control experimental sobre los fenómenos 
transitorios. 


Los cambios conductuales transitorios pueden producirse a veces debido a que la conducta bajo 
observación está siendo mantenida en lo que podríamos denominar un “estado fronterizo”. En 
nuestra discusión de la variabilidad que resulta de un control experimental débil, ya se ha 
presentado un ejemplo de ello (capítulo 5, página 167). Esta situación tiene gran probabilidad de 
presentarse si la función que describe la relación entre la conducta y una variable controladora 
importante es discontinuada, o si la función cambia rápidamente en un pequeño intervalo de 
valores de dicha variable. Damos un ejemplo a continuación. 
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FIGURA 40. Relación entre el intervalo respuesta-shock y la tasa de respuestas de evitación. 
(Adaptado de Sidman, 70.) 


La figura 40 ilustra una relación entre la tasa de respuestas de evitación y el intervalo de tiempo en 
que cada respuesta pospone un shock eléctrico (intervalo respuesta-shock). Pueden observarse 
que la tasa de respuesta muestra un “pico” muy agudo en las proximidades de los siete segundos 
para las condiciones concretas bajo las que se obtuvo esta curva. Variaciones pequeñas en el 
intervalo respuesta-shock a ambos lados de este máximo producen cambios conductuales 
relativamente profundos, con lo que estos datos nos indican que este sujeto probablemente se 


hallará en un estado fronterizo si intentamos mantener la conducta de evitación utilizando un 
intervalo respuesta-shock de siete segundos. Mientras que la tasa característica se mantendrá 
alta, bajo control de intervalo respuesta-shock de siete segundos, probablemente se observarán 
períodos transitorios en los que la tasa de respuesta será baja. 


Un factor que determinará la frecuencia y la duración de estos cambios transitorios en la tasa será 
el grado de variabilidad en los aparatos de programación. Cuanto más variable sea el temporizador 
que utilicemos para programa el intervalo respuesta-shock, con más probabilidad observaremos 
períodos pasajeros de tasas de respuesta bajas. Las variaciones en otros factores presentes en la 
situación tendrán el mismo efecto. En nuestro ejemplo, la intensidad del shock sería un factor 
evidentemente sospechoso, dado que esta variable es considerablemente difícil de controlar. 
Cualquier factor que produzca variabilidad en las propiedades temporales de la respuesta, 
aumentará también la probabilidad de que se produzcan cambios transitorios. Enunciándolo de un 
modo poco riguroso, podemos decir que un intervalo respuesta-shock de siete segundos puede 
parecerle al sujeto, en algunas ocasiones, de cinco o diez segundos de duración. Este tipo de 
eventualidades pueden tener un marcado efecto sobre la tasa de respuesta. 


Este ejemplo demuestra de nuevo la necesidad de familiarizarse considerablemente con las 
características de cualquier conducta de línea de base que se decida utilizar experimentalmente. 
Un experimento diseñado a partir de una línea de base insuficientemente comprendida, puede 
resultar contaminado con una variabilidad transitoria, que se hubiera podido evitar mediante una 
selección más adecuada de los valores de los parámetros que controlan la línea de base en 
cuestión. Ello nos conduce directamente a nuestro próximo problema de diseño experimental. 


XI. Selección de una línea de base apropiada 


Algunas investigaciones tienen como objetivo el estudio de las relaciones existentes entre varios 
tipos de línea de base y operaciones experimentales concretas. Las líneas de base constituirán, por 
sí mismas, parámetros del fenómeno en cuestión, y se seleccionarán basándose en 
consideraciones propias del problema que se deba resolver. 


Cuando la propia línea de base no debe ser manipulada como variable independiente, su selección 
se convierte en un paso crítico del diseño de un experimento. Una elección imprudente puede 
convertir en un fracaso un estudio por otra parte bien concebido, ya sea impidiendo la 
observación de un fenómeno, ya sea llevando a una interpretación errónea de resultados. La línea 
de base ideal debe poseer tres virtudes capitales si no queremos que oscurezca o bien los datos 
que con ella obtengamos, o bien la interpretación de los mismo. Estas virtudes son: estabilidad, 
sensibilidad y controles incorporados de los procesos ajenos al propósito perseguido. 


ESTABILIDAD 


El primer requisito es obvio. Si la conducta de línea de base es excesivamente variable, cualquier 
cambio producido por las operaciones experimentales importantes resultará disfrazado. 
En consecuencia, se podría llegar a la conclusión incorrecta, mediante criterios estadísticos o de 
otro tipo, de que la manipulación en cuestión no ejerce ningún efecto. 


La estabilidad mantenida a lo largo de un dilatado período de tiempo, a menudo permitirá al 
investigador evaluar su manipulación experimental mediante la replicación intrasujeto. Si la línea 
de base es reversible, podrá introducir la operación experimental repetidas veces en el curso de 
una sesión, obteniendo de este modo una estimación económica de la reproductibilidad de los 
cambios conductuales observados. La operación experimental puede consistir en un cambio de la 
contingencia de reforzamiento, con o sin control de estímulos, una alteración en el ambiente 
interno o externo del sujeto, la aplicación de castigo o cualquiera de otras muchas posibilidades. 
Si la operación no ejerce un grado apreciable de control conductual, no hay modo más refinado de 
demostrarlo que aplicando y retirando varias veces la operación en cuestión en el transcurso de 
un experimento. Sin embargo, para llevar a cabo este tipo de demostración, el investigador deberá 
seleccionar una línea de base que se mantenga estable a todo lo largo del experimento. 


SENSIBILIDAD 


La estabilidad constituye, pues, el primer requisito de un línea de base. Sin embargo, puede 
resultar imposible observar un cambio conductual sobre una línea de base que, a pesar de ser 
estable, sea insensible. Para poder efectuar una selección adecuada con respecto a la sensibilidad, 


debe poseerse un conocimiento a fondo de las propiedades conocidas de las líneas de base 
disponibles. Supongamos, por ejemplo, que se desea investigar los efectos de la deprivación de 
comida sobre la tasa de respuesta. ¿Qué línea de base reflejará mejor las variaciones en la 
deprivación? Se sabe que los programas de reforzamiento de razón fija generan una conducta 
extremadamente estable, y podríamos estar tentados de mantener la conducta de línea de base 
mediante este programa. Sin embargo, el programa de reforzamiento de razón fija genera lo que 
podría considerarse una forma de cohesión interna muy sólida. Las respuestas que se emiten al 
principio de la “cuenta” de razón, inmediatamente después que haya tenido lugar un 
reforzamiento, actúan como estímulos discriminativos para las siguientes, y éstas, a su vez, actúan 
como refuerzo de las primeras. Debería vencerse este poderoso control interno para que pudieran 
mostrarse en la tasa de respuesta los cambios operados en la deprivación. Se ha demostrado, por 
consiguiente, que las tasas generadas por un programa de razón fija son relativamente insensibles 
a cierto número de variables, a pesar de que otros aspectos de la conducta de razón fija puedan 
reflejar con facilidad los cambios operados en el ambiente. Debido a ello, y a menos que se esté 
expresamente interesado en los efectos que la deprivación ejerce sobre la conducta de razón fija, 
será más aconsejable utilizar algún otro tipo de línea de base. 


La insensibilidad de una línea de base conductual puede ser producida, en ocasiones, a través de 
las propias operaciones experimentales, dado que algunas de ellas, por su misma naturaleza, 
impiden realizar una descripción exhaustiva de sus efectos, a menos que se tomen precauciones 
especiales. Podríamos encontrarnos con una situación de este tipo sí, por ejemplo, 
interrumpiésemos un experimento durante diez minutos cada vez que el sujeto dejara transcurrir, 
en un programa de reforzamiento de intervalo variable, menos de dos segundos entre dos 
respuestas consecutivas. Es decir, que cada pausa menor de dos segundos produciría un período 
de diez minutos, señalado por la presentación de un estímulo, durante el cual el sujeto no podría 
obtener reforzamiento alguno. 


Un método de estudiar los efectos de una operación de este tipo sería registrar los intervalos de 
tiempo entre respuestas sucesivas (tiempo entre respuestas), mientras el programa de intervalo 
variable estuviera en vigor. Sin embargo, la operación de interrumpir el experimento después de 
cada pausa corta eliminaría artificialmente la mayor parte de los tiempos entre respuestas 
menores de dos segundos, dado que el sujeto no responde durante el período de time-out. 
Nuestra línea de base sería, por lo tanto, insensible a los cambios que, de otro modo, tal vez se 
producirían en la frecuencia de tiempos entre respuestas menores de dos segundos. 


La solución a este problema es relativamente simple, dado que la insensibilidad resulta, no de la 
línea de base de intervalo variable, sino de nuestro método de programar la operación 
experimental. Podemos recuperar la sensibilidad, excepto para una pequeña porción 
insignificante, simplemente introduciendo el time-out, sólo de un modo ocasional, con la aparición 
de la pausa de menos de dos segundos, en lugar de hacerlo cada vez que ello ocurra. ** 
La introducción del time-out puede programarse, a su vez, bajo un intervalo variable, o bien bajo 
cualquier otro programa que se juzgue adecuado. Con ello conseguiremos reducir al mínimo las 
restricciones sobre nuestra observación de la conducta de línea de base. 


Una línea de base ideal sería aquella en que habría tan poca interferencia debida a otras variables 
como fuera posible. El número de factores con tendencia a oponerse a cualquier cambio en la 
conducta que pudiera resultar de la manipulación experimental debería ser mínimo. Un programa 
de intervalo variable, si se diseña adecuadamente, cumple con este requisito con gran 
aproximación, dado que cuando los reforzamientos se programan para que tengan lugar a 
intervalos variables y de imposible predicción, hay una probabilidad mínima de que la respuesta 
caiga bajo un control temporal específico, como sucede con los programas de intervalo fijo y de 
respuestas espaciadas, o bajo el control de la propia conducta, tal como ocurre en los programas 
de razón. 


Incluso aquí, sin embargo, se debe estar íntimamente familiarizado con las propiedades de los 
programas de intervalo variable, si se desea generar una línea de base máximamente sensible. 
Resulta muy fácil incorporar a una cinta programadora de intervalo variable unas pocas secuencias 
que confieran a la conducta propiedades de razón o de intervalo, o que permitan la formación de 
cualquier otro tipo de discriminación. Si la cinta tiene un número relativamente elevado de 
intervalos largos, la conducta tal vez llegue a mostrar los codos característicos del programa de 
intervalo fijo. Un número excesivo de intervalos cortos puede dar lugar a que se produzca una 
curvatura negativa parecida a la de la extinción en los períodos entre reforzamientos más largos. 
Una preponderancia de secuencias en que un cierto número de intervalos cortos consecutivos 
vaya seguido de un intervalo muy largo, ocasionará disminuciones bruscas en la tasa cada vez que 
transcurra un período corto sin reforzamiento. Es probable que las contingencias de este tipo 
resulten totalmente ajenas a las variables de mayor interés, y que actúen en el sentido de reducir 
la sensibilidad de la línea de base a los cambios operados en las variables manipuladas. 


CONTROL DE PROCESOS EXTRÍNSECOS 


He seleccionado el ejemplo anterior debido a que también contiene elementos relacionados con el 
tercer criterio de una buena línea de base conductual. Dicho criterio exige que la línea de base sea 
tal que permita el control, o la eliminación, de los procesos conductuales no deseados. Un criterio 
así resulta necesario, no sólo porque los procesos extraños pueden reducir la sensibilidad de la 
línea de base, sino también porque impiden una evaluación inequívoca de los datos. Una cinta 
programadora de intervalo variable, por ejemplo, que genere algunas de las características de la 
conducta de intervalo fijo, también introduce los complejos procesos implicados en la conducta 
correspondiente a este programa. Estos procesos son interesantes por sí mismos, pero sólo sirven 
para complicar una descripción simple de la conducta que se supone que se halla bajo un control 
temporal mínimo. Tiene más importancia aún el hecho de que, en una situación de este tipo, los 
procesos de intervalo fijo no estén sometidos a control experimental, y su interacción con las 
variables de mayor interés resulte difícil de identificar. Si se está interesado en estudiar tales 
interacciones, resultaría más apropiado diseñar un experimento expresamente orientado a este 
fin. 


Determinadas líneas de base pueden generar, de otras maneras, procesos que complican u 
oscurecen los hallazgos experimentales. Una fuente potencial de dificultad puede surgir en las 
líneas de base caracterizadas por algún tipo de ciclicidad. Supongamos, por ejemplo, que 
deseamos evaluar una transición conductual a partir de una línea de base de conducta de 
intervalo fijo. El desarrollo de la transición puede muy bien ser función del punto, en el codo de 
intervalo fijo, en que iniciemos el cambio de las condiciones experimentales. Puede darse una 
situación similar en la conducta de razón fija. Si el interés principal gira alrededor de las 
interacciones entre la operación experimental y la línea de base, se deberá introducir 
deliberadamente dicha operación en varios puntos de los ciclos de razón o de intervalo, 
comparando después las transiciones resultantes. Sin embargo, si dichas interacciones son ajenas 
al problema central, el experimentador hará bien en respetar el ciclo, cortándolo por el mismo 
punto cada vez que deba introducir una nueva operación, o en seleccionar una línea de base que 
no presente en absoluto un carácter cíclico. 


Los programas de razón fija y de intervalo fijo se caracterizan por unos ciclos conductuales 
relativamente nítidos, pero éstas y otras líneas de base también pueden sufrir fluctuaciones 
cíclicas menos obvias, algunas de las cuales resultan poco evidentes debido a que se producen 
muy a largo plazo. Un caso intermedio lo constituye el precalentamiento, en el cual la conducta 
quizá no alcance su estado estable hasta que hayan transcurrido varias horas desde el principio de 
cada sesión experimental. Si se desea eliminar toda interacción del fenómeno investigado con las 
variables responsables del precalentamiento, el experimentador tiene tres caminos a seguir: 
(1) puede emplear una línea de base que no se caracterice por la aparición de precalentamiento; 
(2) puede esperar a que la línea de base haya alcanzado su estado estable antes de introducir un 
cambio en las condiciones experimentales, y (3)puede dejar de lado temporalmente su problema 
principal, y enfrascarse en una investigación del propio precalentamiento con la esperanza de 
conseguir el suficiente control experimental mediante el cual poder eliminar el precalentamiento 
de la línea de base. 


Los cambios cíclicos en la conducta también pueden pasar desapercibidos por el simple hecho de 
no ser registrados. En todos los experimentos hay muchos aspectos que no se registran nuestros 
instrumentos, y debemos estar atentos a la posibilidad de que las propiedades no registradas de la 
conducta de línea de base se interfiera con nuestras operaciones experimentales. Así, por 
ejemplo, en el programa de DRL, donde la contingencia de reforzamiento requiere que el sujeto se 
abstenga de emitir la respuesta registrada durante un período de tiempo dado, el estado de la 
conducta en este intervalo de espera sufre un cambio progresivo que no se manifiesta hasta que 
aplicamos determinadas técnicas de sondeo. Si se utiliza un programa de este tipo como línea de 
base, la introducción de una nueva variable al principio del intervalo de espera, es probable que 
tenga un efecto distinto del que hubiese producido de haberse introducido más tarde. ”? 


Otra fuente de conducta que escapa al registro, la constituyen las respuestas implica das en ingerir 
la comida que comúnmente se emplea como reforzador en los experimentos con animales. 
A menos que la conducta de línea de base sea mantenida por un programa de reforzamiento 
intermitente, el tiempo empleado en comer probablemente ocupe una parte considerable del 


período de observación. Un hecho todavía más grave es la interferencia producida por esta 
conducta cuando no se ha logrado someterla a un control por estímulos estricto. A menos que se 
proporcione un estímulo eficaz asociado al mecanismo administrador de comida, y se enseñe al 
animal a aproximarse al comedero en presencia de este estímulo solamente, la conducta 
consistente en intentos de ingerir la comida ocupará un importante segmento, aunque sin 
registrar, de la línea de base. Debido a ello, no resultará claro si cualquier cambio que podamos 
inducir en la conducta registrada no será un mero reflejo indirecto de los cambios que tienen lugar 
en la conducta asociada con la acción de comer. 


Otro tipo de proceso extraño que normalmente se debe evitar en una línea de base en el que se 
opone, de modo real, a los efectos de la variable manipulada. Por ejemplo, Ferster llevó a cabo un 
experimento para investigar los efectos de castigar respuestas rápidas por medio de un time-out. 
El primer problema con que se enfrentó fue la selección de una técnica para mantener una 
conducta de línea de base a partir de la cual medir la operación de castigar. Es significativo el 
hecho de que renunciar a utilizar un programa de reforzamiento de razón fija como línea de base, 
debido a que “las propiedades del programa de razón producen un reforzamiento diferencial de 
las tasas de respuesta altas, que se oponen a los efectos del castigo” (33, página 24). Ello no quiere 
decir que el castigo de una conducta de razón fija no sea interesante. Sin embargo, en el contexto 
de la investigación de Ferster, la complicación de un proceso que se opusiera a la operación 
principal no tenía nada que ver con el problema que estaba estudiando. 


A menudo se produce una situación similar al estudiar los efectos que los fármacos ejercen sobre 
la conducta. Una droga tranquilizante puede tender a disminuir la probabilidad de que se emita la 
conducta cuya función es evitar un shock, pero esta probabilidad disminuida aumentará, a su vez, 
la frecuencia con que el sujeto recibe los shocks. Esta frecuencia de shocks más alta puede 
oponerse a los efectos de la droga, y el experimentador quizá saque la conclusión de que ésta 
tiene poca o ninguna influencia sobre la conducta de evitación. La selección de una línea de base 
en que se extingue un condicionamiento de evitación, o bien que esté constituida por un shock 
intermitente, tenderá a reducir al mínimo el efecto opuesto de los shocks con respecto a la acción 
del fármaco. 


LÍNEAS DE BASE DE ELEMENTOS MÚLTIPLES. CONTROL POR ESTÍMULOS 


Cuando los efectos de una operación experimental deben valorarse con relación a más de una 
línea de base, el procedimiento tradicionalmente utilizado ha sido el de emplear distintos grupos 
de sujetos para cada línea de base, y a continuación llevar a cabo comparaciones entre los grupos. 
Para citar como ejemplo un experimento que se ha llevado a cabo con mucha frecuencia, 
supongamos que queremos comprar los efectos de la extinción experimental en dos líneas de 
base, una de ellas mantenida por un reforzamiento continuo y la otra por algún programa de 
reforzamiento intermitente. El procedimiento más comúnmente empleado en este tipo de 
experimentos ha sido el utilizar dos grupos de sujetos, manteniendo la conducta de cada uno 
mediante su programa de reforzamiento correspondiente. Luego, una vez que se ha llevado a cabo 


la extinción, se efectúan una comparación entre, por ejemplo, la resistencia media a la extinción 
que muestra cada uno de los dos grupos de línea de base. 


Una comparación de este tipo adolece de la pérdida de poder conclusivo que es consecuencia 
ineludible de las comparaciones entre grupos. Todos los factores no analizados que producen 
variabilidad entre sujetos se confunden, tanto con los factores de línea de base como con los 
efectos que la operación de extinguir ejerce sobre las líneas de base. 


Un paso técnico más adelantado consistiría en emplear los mismos sujetos para cada una de las 
líneas de base. De esta forma, los sujetos podrían ser expuestos en primer lugar, por ejemplo, al 
programa de reforzamiento continuo seguido de la extinción experimental, y a continuación, al 
programa intermitente, seguido asimismo por una extinción. Algunas de las dificultades implicadas 
en un procedimiento de este tipo ya han sido discutidas (capítulo 3). Sin embargo, dado el 
propósito que nos ocupa, podemos resaltar las ventajas de eliminar la variabilidad entre sujetos, 
tanto de las propias líneas de base, como de su interacción con la operación experimental. A pesar 
de todo, no obtendremos aún una situación tan clara como desearíamos. Aunque la variabilidad 
entre sujetos ha sido eliminada, nuestros datos se hallarán todavía contaminados por todos los 
factores incontrolados que actúan a lo largo del tiempo produciendo la variabilidad intrasujeto de 
un período experimental al siguiente. A menos que establezcamos unos controles explícitos, 
nuestros datos continuarán siendo vulnerables a la sospecha de que cualquier diferencia 
observada en los efectos de la operación de extinguir, podría haber tenido lugar incluso en dos 
aplicaciones sucesivas de dicha operación a la misma línea de base. 


La mejor solución a este problema consistiría en utilizar un línea de base de elementos múltiples 
en un sujeto individual, de modo que éste pudiera ser expuesto a ambas líneas de base en un 
único período experimental. La operación experimental podrá aplicarse, entonces, a cada 
elemento de la línea de base en rápida sucesión o, en algunos casos, incluso simultáneamente. 


Para terminar con nuestro ejemplo, podríamos someter nuestras dos líneas de base 
(una mantenida por reforzamiento continuo y la otra por reforzamiento intermitente) a un control 
por estímulos, y presentar alternativamente los dos programas al sujeto en el transcurso de la 
sesión experimental. Supongamos que nuestro sujeto es un mono, y que la respuesta registrada es 
apretar una palanca. Cuando una luz situada encima de la palanca sea de color blanco, cada 
respuesta será reforzada con comida. Cuando la luz sea roja, la respuesta obtendrá reforzamiento 
sólo intermitentemente, según el programa que hayamos decidido emplear como segundo 
elemento de la línea de base múltiple. Ambos estímulos, juntamente con sus programas de 
reforzamiento asociados, pueden programarse en cualquier secuencia temporal que deseemos. 
Para simplificar, sin embargo, presentémoslos alternativamente en períodos de cinco minutos. 
Cuando la conducta apropiada a cada programa se haya estabilizado en presencia de su estímulo 
correspondiente, podremos introducir la operación de extinción experimental. Comparando las 
conductas emitidas en presencia de los dos estímulos, podremos evaluar la interacción entre la 
operación de extinguir y cada uno de los elementos de la línea de base por separado. 


Con ello, habremos conseguido mucho más que la eliminación de la variabilidad entre sujetos. 
En el caso ideal, el control por estímulos de cada elemento de la línea de base sirve, por así 
decirlo, para dividir el sujeto individual en dos o más organismos idénticos, cada uno de ellos 
emitiendo la conducta adecuada a las variables que la controlan, y estrictamente comparable con 
respecto a los factores que en condiciones normales hubiesen producido una variabilidad 
intrasujeto. El hecho de si este caso ideal tiene lugar en la práctica alguna vez, aún está por ver, 
dado que es muy posible que se produzcan interacciones entre los elementos de la línea de base 
múltiple. Sin embargo, las ventajas de esta técnica son tan grandes, que siempre merece la pena 
intentar ponerla en práctica. Los problemas derivados de las interacciones entre los elementos de 
la línea de base a menudo pueden superarse, lo cual discutiremos en su momento con más 
detalle. 


El estudiante debe darse cuenta de que no sugiero el uso de líneas de base de elementos múltiples 
como medio de ahorrar tiempo, dado que pueden exigir un trabajo y un tiempo considerable, 
tanto para conseguir el control conductual requerido, como para llevar a cabo las comprobaciones 
experimentales de posible existencia de interacciones. El valor de la línea de base de elementos 
múltiples no consiste tanto en su comodidad, como en el grado de control experimental que 
proporciona sobre fuentes de variabilidad normalmente difíciles de manejar. Además, la línea de 
base de elementos múltiples proporciona muestras temporales repetidas y frecuentes de cada 
elemento, y cualquier pérdida de control experimental que pueda tener lugar es puesta 
inmediatamente de manifiesto, y puede tomarse en consideración en el momento de evaluar los 
datos. Esta virtud de las líneas de base de elementos múltiples repetidos, es lo suficientemente 
importante para justificar un prejuicio evaluativo en favor de cualquier experimento que utilice 
esta técnica en comparación con otro que ataque el mismo problema de un modo más tradicional. 
La replicación repetida de cada elemento de la línea de base permite un grado de confianza en la 
adecuación del control experimental que de otro modo sería imposible. 


Se han descrito muchas variedades de líneas de base de elementos múltiples en el tratado de 
Ferster y Siknner sobre programas de reforzamiento múltiples (34, páginas 503-579). El ejemplo 
que he utilizado aquí lo es también de un programa de reforzamiento múltiple (reforzamiento 
continuo e intermitente). Un ejemplo distinto se ilustra en la figura 29 (capítulo 8), que muestra 
cinco valores de un programa de razón fija, cada uno de ellos sometido a un control por estímulos. 
Utilizando este último procedimiento, no sólo es posible evaluar las tasas de respuesta 
diferencialmente correlacionadas con cada valor de la razón fija, sino también evaluar los efectos 
sobre cada conducta de razón por separado, de operaciones independientes, tales como la 
saciedad, la administración de fármacos, etc. 


El concepto de líneas de base de elementos múltiples sometidos al control por estímulos, es 
generalizable a otros métodos de manipulación conductual que no sean los programas de 
reforzamiento. Los dos, o más, estímulos de líneas de base de elementos múltiples pueden 
correlacionarse, para citar algunas variables clásicas, con distintas intensidades de shock, distintas 
magnitudes o tipos de reforzamiento, diferentes retardos del mismo y distintos intervalos entre 
aplicaciones consecutivas de la variable, así como con formas de conducta topográficamente 


distintas, e inversiones en la discriminación. El número de variables a las que es posible aplicar las 
técnicas es ilimitado. Si el experimento está relacionado con la conducta de evitación, cada 
respuesta puede posponer un shock de un miliamperio de intensidad en presencia del estímulo A; 
en presencia del estímulo B el shock a evitar puede ser de tres miliamperios. Del mismo modo, si 
se desea investigar los efectos de un fármaco sobre la conducta en situaciones tanto aversivas 
como positivamente reforzantes, podemos permitir que una respuesta obtenga comida en 
presencia del estímulo A, y hacer que evite un shock en presencia del estímulo B. podríamos 
incluso usar el mismo tipo de programa de reforzamiento para ambos estímulos. Así, se podrían 
requerir diez respuestas por cada reforzamiento con comida en presencia del estímulo A, y que, 
ante el estímulo B, se pospusiera un shock cada diez respuestas. Podríamos pasar luego a evaluar 
los efectos de un fármaco determinado sobre cada uno de los elementos de la línea de base. No se 
ha sacado aún todo el provecho posible de este método, que ofrece, sin embargo, posibilidades 
fascinantes de carácter tanto metodológico como sistemático. 


MANIPULACIONES DE ELEMENTOS MÚLTIPLES 


Hasta aquí, nuestra discusión se ha limitado a aquellos casos en que deseábamos investigar las 
relaciones entre una operación experimental única y más de una línea de base conductual. Uno de 
los procedimientos sugeridos para conseguirlo era el uso de una línea de base de elementos 
múltiples sometidos a un control por estímulos. Antes de iniciar el estudio de otras técnicas 
apropiadas para atacar este tipo de problema, podemos considerar el caso en que nos interese 
investigar la interacción existente entre una línea de base conductual única y varias operaciones 
experimentales cualitativa o cuantitativamente distintas. 


Supongamos, por ejemplo, que se mantiene la conducta de línea de base mediante un programa 
de reforzamiento de intervalo variable. Nuestro interés general puede girar alrededor de la 
ruptura que se produce en esta línea de base cuando presentamos un estímulo cuya terminación 
va acompañada de un shock inevitable. Se ha demostrado que este tipo de estímulo, después de 
cierto número de presentaciones junto con el shock, da lugar a un paro total (supresión) de la 
conducta de línea de base en curso (ver figura 5 y 6, capítulo 3). Nuestro interés inmediato se 
puede centrar en la forma en que esta supresión conductual se desarrolla en función de la 
probabilidad de que el shock se produzca al final del estímulo. Es decir, ¿se desarrollará la 
supresión inmediatamente y será más completa cuando cada estímulo se asocie con un shock que 
cuando este aparejamiento sólo tenga lugar, por ejemplo, en un 30 por ciento de los casos? 


En vez de emplear dos grupos de sujetos, sometiéndolos por separado a cada porcentaje de 
shocks, podemos establecer una correlación entre las dos operaciones y un estímulo distinto para 
cada una, y someter un organismo único a las dos operaciones en cuestión. Así, por ejemplo, 
mientras se está emitiendo la conducta de línea de base en estado estable, mantenido por un 
programa de reforzamiento de intervalo variable, podemos presentar ocasionalmente un tono 
continuado al sujeto, y, en otros momentos, una serie de “clics”. Cada presentación de un 
estímulo dura, pongamos por caso, tres minutos. Al término de cada período en que se ha 


presentado el tono continuado, administramos un shock inevitable al animal. Sin embargo, al 
terminar los estímulos constituidos por los “clics”, sólo administramos un shock tres veces de cada 
diez como promedio, dejando que los demás períodos de “clics” acaben sin ningún shock. 
A continuación podemos observar el desarrollo de la supresión de la línea de base en presencia de 
cada estímulo separadamente. Algunos datos preliminares, obtenidos por Stein, sugieren que la 
supresión conductual se desarrolla más rápidamente en presencia del estímulo que siempre va 
aparejando con el shock.* 


Nos encontramos, pues, ante un caso en que dos operaciones cuantitativamente distintas, cada 
una bajo el control de un estímulo distinto, se aplican a una conducta de línea de base única. 
De este modo, es posible evaluar el efecto que ejercen ambas operaciones en un solo organismo. 
Si ello fuera de interés, se podría continuar investigando la interacción de la probabilidad de 
shocks con un cierto número de otras variables, tales como la intensidad de shock, las condiciones 
de reforzamiento, etcétera. Finalmente, los efectos de la probabilidad de shock sobre la 
resistencia a la extinción podrían estudiarse eliminando el shock de ambos estímulos y 
examinando la recuperación subsiguiente de la línea de base en presencia de aquellos. 


No existe ninguna razón por la que se deba confinar una operación de elementos múltiples a dos 
manipulaciones únicamente. Mediante una selección adecuada del sujeto experimental, será 
posible obtener una serie de puntos correspondientes a una relación funcional entre la conducta 
de línea de base y distintas variaciones cuantitativas de una operación experimental. Una función 
de este tipo estará libre de variabilidad entre sujetos. Por otra parte, la variabilidad intrasujeto 
será generalmente mínima o, en el caso de que dicha variabilidad esté presente hasta el punto de 
perturbar el experimento, podrá ser detectada por medio de las variaciones excepcionales que 
presentará la conducta de línea de base en la mayor parte de las ocasiones. 


Un excelente ejemplo de una operación de elementos múltiples ha sido proporcionado por 
Guttman y sus colaboradores, que la han utilizado para investigar el gradiente de generalización 
en la paloma.* El procedimiento de línea de base que emplearon consistía en una extinción 
después de un programa de reforzamiento con comida de intervalo variable. Se eligió la extinción 
como línea de base debido a que el reforzamiento con comida habría introducido factores 
irrelevantes que hubiesen complicado la evaluación de los datos empleados en la determinación 
de la generalidad. En la extinción que sigue a un programa de intervalo variable se mantiene una 
tasa estable durante un período de tiempo lo suficientemente largo para permitir llevar a cabo un 
elevado número de variaciones cuantitativas en la operación experimental. Dicha operación 
consistió simplemente en producir cambios periódicos en la longitud de onda de un estímulo, que 
se había mantenido constante a lo largo del período de reforzamiento de intervalo variable 
anterior. El sujeto fue sometido a un gran número de variaciones de la longitud de onda, 
registrándose el total de respuestas emitidas en presencia de cada una de ellas. Se observó que el 
número de respuestas disminuía gradualmente a medida que la longitud de onda presentada se 
apartaba cada vez más de la original, o sea, de la longitud de onda constante en presencia de la 
cual se llevó a cabo el reforzamiento. El resultado de esta manipulación de elementos múltiples 


fue una relación funcional relativamente detallada entre la longitud de onda y la tasa de respuesta 
en un organismo individual (ver figura 20, capítulo 6). 


He utilizado una técnica similar para obtener una gradiente de generalización en conducta de 
evitación. La línea de base, en lugar de ser una extinción después de un reforzamiento con comida, 
fue la extinción que seguía a un condicionamiento de evitación. En este caso, el sujeto era un 
mono, y la dimensión del estímulo era la frecuencia con que sonaban unos “clics” en lugar de la 
longitud de onda. Durante el condicionamiento de evitación, los “clics” se presentaron a una tasa 
de dos por segundo, mientras que durante la extinción esta frecuencia variaba de dos a seis “clics” 
por segundo. De nuevo se observó que el número de respuestas disminuía a medida que la 
frecuencia de los “clics” difería más acusadamente del valor de dos por segundo. Los sujetos, los 
estímulos, la conducta de línea de base. Así como un cierto número de otros factores, diferían de 
la demostración original llevada a cabo por Guttman, pero la considerable similitud entre los 
resultados obtenidos proporciona una sólida evidencia de que esta operación de elementos 
múltiples posee una gran generalidad. 


Mediante técnicas similares pueden atacarse otros problemas, tanto nuevos como clásicos. 
Una infinidad de datos esperan, para ser abordados, la combinación de líneas de base y 
operaciones de elementos múltiples. Podríamos estar interesados en investigar las posibles 
variaciones en el gradiente de generalización en función de la intensidad de shock. Para llevar a 
cabo esta experimentación, podemos establecer una línea de base de evitación múltiple, en la que 
varias intensidades de shock estén correlacionadas, por ejemplo, con distintos estímulos visuales. 
Cuando el disco sobre el cual responde el animal esté iluminado con una longitud de onda da da, el 
sujeto evitará un shock de una determinada intensidad. Cuando la iluminación del disco cambie, la 
intensidad del shock también cambiará, correlacionándose por este procedimiento una serie de 
longitudes de onda con distintas intensidades de shock. 


En presencia de todos los elementos de la línea de base múltiple, hacemos sonar de un modo 
continuado una serie de “clics”, a una frecuencia, por ejemplo, de dos por segundo. Más tarde, 
durante la extinción de evitación, podremos variar la frecuencia de “clics” junto con los distintos 
valores de intensidad de shock de nuestra línea de base múltiple. Es decir, continuamos 
presentando las distintas iluminaciones de disco que controlan por separado cada tasa de 
respuestas apropiada a la intensidad de shock con que se había asociado durante el 
condicionamiento de evitación. Sin embargo, la frecuencia de “clics” que acompaña a cada 
longitud de onda varía ahora con cada presentación. En el transcurso de una única sesión 
experimental, cada frecuencia de “clics” puede presentarse en combinación con cada una de las 
distintas longitudes de onda. Podemos tratar luego una familia de curvas que pongan en relación 
la tasa de respuesta con la frecuencia de “clics” para cada longitud de onda. De este modo, con la 
longitud de onda controlando los elementos de la línea de base múltiple, y las distintas frecuencias 
de “clics” comprendidas en la manipulación de elementos múltiples, dispondremos de una serie 
de curvas de generalización para un solo organismo. Los gradientes reflejarán las interacciones, si 
es que existen, entre la generalización de estímulos y la intensidad del shock. 


LÍNEAS DE BASE DE ELEMENTOS MÚLTIPLES. CONTROL CONCURRENTE 


Hasta este momento, he discutido solamente el tipo de línea de base de elementos múltiples en 
que la conducta del sujeto es fraccionada por medio del control por estímulos de cada elemento 
por separado. Las líneas de base de este tipo ofrecen tractivas posibilidades ya que pueden ayudar 
a conferir a una ciencia psicológica experimental el grado de rigor y precisión que su objeto de 
estudio exige. Sin embargo, distan mucho de ser la última palabra, ya que en la medida en que los 
componentes de una línea de base estén separados por períodos de tiempo, por más cortos que 
sean, persiste una probabilidad de que factores incontrolados afecten diferencialmente a cada 
elemento. El siguiente paso hacia adelante consiste en programar dos o más líneas de base 
conductuales al mismo tiempo (34, páginas 703-721). 


Hay muchas maneras de programar dos líneas de base concurrentemente, y puede decirse que la 
explotación de esta técnica tan sólo acaba de empezar. Tal como siempre ocurre en el desarrollo 
inicial de un nuevo método, han surgido problemas inesperados, tanto de naturaleza técnica como 
sistemática. Por el momento, pasaré por alto estos problemas, y solamente analizaré dos de los 
principales tipos de líneas de base concurrentes. 


Tal vez el procedimiento más evidente para generar dos líneas de base de un modo simultáneo 
sea el de utilizar dos respuestas, sometiendo cada una de ellas al control de un conjunto separado 
de contingencias que las mantengan. Ya he hablado en el capítulo 7, páginas 223-227, acera de 
dos líneas de base concurrentes de este tipo. Una de las dos respuestas era reforzada con comida 
bajo un programa de reforzamiento de razón fija (o de intervalo variable), mientras que la otra 
respuesta cumplía la función, simultáneamente, de evitar la administración de shocks eléctricos. 
Estas dos líneas de base se utilizaron para estudiar un aspecto del fenómeno de supresión 
condicionada al que ya me he referido varias veces anteriormente. 


En la figura 25, capítulo 7, vimos lo que sucedía cuando presentábamos, cada diez minutos, un 
estímulo de cinco minutos de duración, y administrábamos un shock inevitable coincidiendo con la 
terminación de cada estímulo. La respuesta de cada línea de base al estímulo anterior al shock era 
un ejemplo típico de lo que se observa cuando las dos conductas de línea de base son generadas 
por separado. La respuesta reforzada con comida fue suprimida, mientras que la respuesta de 
evitación resultó facilitada. 


Esta demostración es sumamente elegante, puesto que las diferencias individuales entre sujetos 
no constituyen ningún problema y la aplicación simultánea del estímulo a ambas líneas de base 
elimina variaciones temporales del tipo que contribuyen a producir la inestabilidad intrasujeto. 
Tal como ocurre con la línea de base múltiple sometida a un control por estímulos, la conducta de 
nuestro sujeto se fracciona en dos muestras. En este caso, sin embargo, no hay ningún intervalo 
de tiempo que medie entre la aplicación de la operación experimental y cada muestra. He aquí, 


por lo tanto, otro modo de obtener dos conductas de línea de base en un solo sujeto, con la 
ventaja adicional de que ambas conductas se emiten al mismo tiempo. De este modo, no hay 
posibilidad de que ninguna de las dos muestras sufra variaciones mientras está esperando su 
turno para entrar en acción. Estos cambios pueden tener lugar, por supuesto, entre las 
presentaciones de estímulos e incluso mientras éstas se producen, aunque los factores causantes 
de estas variaciones actuarán al menos sobre ambas líneas de base al mismo tiempo. 


La figura 41 ilustra la conducta generada por otra línea de base de dos respuestas concurrentes. En 
este caso, cada respuesta a la palanca emitida por el mono posponía un shock durante 20 
segundos. El conjunto inferior de curvas muestra la conducta de evitación de apretar la palanca. La 
segunda respuesta, tirar de una cadena, es reforzada por la aparición de un time-out de cinco 
minutos de duración. En estos períodos de time-out se apagaban todas las luces del recinto 
experimental y se desconectaba el circuito de shock. Por lo tanto, cada uno de estos períodos 
daba al animal cinco minutos de tregua en el procedimiento de evitación y, de un modo 
característico, no se emitían respuestas a la palanca o a la cadena en absoluto. 
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FIGURA 41. Registro acumulativo de la conducta bajo un procedimiento concurrente de doble 
respuesta. Las curvas de la mitad inferior muestran la conducta de apretar la palanca, en que cada 
respuesta pospone el shock durante 20 segundos. Las curvas de la mitad superior, representadas 
sobre el mismo eje de abscisas (tiempo), muestran la conducta de tirar de una cadena en que cada 
100 respuestas consecutivas proporcionaban al mono una tregua (time-out) en el procedimiento 
de evitación. Los pequeños desplazamientos oblicuos en ambos conjuntos de curvas indican los 
períodos de time-out durante los cuales se desconectaron los aparatos registradores. Los números 
situados sobre las curvas identifican uno de cada cuatro períodos de time-out a fin de facilitar la 
comparación entre los dos registros. 


Sin embargo, no todas las respuestas a la cadena producían el time-out, sino que éste se hallaba 
bajo un programa de reforzamiento de razón fija de 100. Es decir, que se requerían 100 respuestas 
a la cadena para que tuviera lugar cada time-out. Además de ello, cien respuestas a la cadena no 
producían por sí solas la aparición del time-out, sino que también debían haber transcurrido al 


menos dos segundos a partir de la última respuesta a la palanca. Así, para cumplir con este 
requisito se tenían que emitir respuestas adicionales hasta que una de ellas tuviera lugar al cabo 
de dos segundos, como mínimo, de la respuesta de apretar la palanca. Se incluyó en el 
procedimiento esta exigencia de dilación de dos segundos a fin de impedir que la conducta de 
apretar la palanca resultara accidentalmente reforzada por la aparición del time-out (ver capítulo 
12). 


El conjunto de curvas situado en la parte superior de la figura 41, es un registro de la conducta de 
tirar de la cadena. Por lo tanto, la figura 41 constituye un registro concurrente de las dos 
respuestas, e ilustra el desarrollo, a medida que transcurre el tiempo, de las líneas de base de 
razón fija y de evitación. Las pequeñas marcas verticales que aparecen en el registro indican los 
períodos de time-out, durante los cuales se detuvo el aparato registrador. Los dos conjuntos de 
curvas se hallaban sobre un eje de tiempo común, y se numeró un time-out de cada cuatro para 
facilitar la identificación de los puntos temporales correspondientes a ambos registros. 


Tal como se puede observar, cada una de las líneas de base toma una forma muy similar a la que 
aparece cuando las contingencias de evitación y razón fija son programadas por separado en vez 
de hacerlo concurrentemente. Las diferencias observadas entre la conducta obtenida por este 
procedimiento y la que se emite por separado, no sólo poseen interés propio, sino que también 
aportan información sobre los procesos implicados en la conducta aislada de razón fija y evitación. 
Por otra parte, además de su interés intrínseco como procesos conductuales complejos, las líneas 
de base concurrentes también constituyen una útil herramienta para investigar otros fenómenos 
tales como los efectos de los estímulos que preceden a un shock inevitable, los factores que 
controlan un reforzamiento condicionado, así como los efectos conductuales de fármacos. 
Mediante cada aplicación de una nueva variable, podemos obtener registros simultáneos de 
cualquier cambio que tenga lugar en las dos líneas de base concurrentes. 


Un segundo tipo importante de líneas de base concurrentes es aquel que sólo se utiliza una única 
respuesta. Para que una respuesta única proporcione dos conductos de línea de base 
concurrentes útiles, debe cumplir con un requisito básico: ha de existir algún modo de distinguir 
las dos conductas en un solo registro. 


El modo más eficaz de llevar a cabo esta distinción consiste en emplear líneas de base que se 
caractericen por pautas temporales diferentes. Esta ingeniosa técnica, como muchas otras a que 
me he referido, fue introducida por Ferster y Skinner (34, páginas 709 y siguientes). Utilizando una 
única respuesta, emplearon un programa de reforzamiento con comida de intervalo fijo, 
concurrentemente con un programa de evitación. La pauta característica que sigue la conducta de 
intervalo fijo facilita relativamente la identificación de los dos componentes de la línea de base. 
Después de cada reforzamiento, el sujeto responde a una baja tasa estable propia de una 
contingencia de evitación, tal como muestra la figura 42. (Normalmente, tal como hemos visto 
antes, cuando le intervalo fijo se programa aisladamente, el período que sigue al reforzamiento 
está exento de respuestas.) Eventualmente se destaca el típico codo de intervalo fijo a partir de la 
tasa de evitación inicialmente estable. De este modo, la conducta se separa en dos componentes, 


uno controlado por la contingencia de evitación y el otro por el programa de intervalo fijo. A partir 
de este momento es posible aplicar alguna operación experimental, tal como la administración de 
un fármaco, y observar sus efectos sobre cada componente de la línea de base concurrente. 
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FIGURA 42. Una actuación concurrente casi perfecta bajo un programa de reforzamiento con 
comida y otro de evitación de shocks actuando al mismo tiempo. Los cortos desplazamientos 
oblicuos indican los reforzamientos con comida. (Adaptado de Ferster y Skinner, 34, p. 714.) 


EL CONTROL SIMULTÁNEO DE LA CONDUCTA POR MEDIO DE MÚLTIPLES VARIABLES 


En la discusión que antecede, he esquivado varias veces el problema central que puede plantearse 
en la utilización de líneas de base complejas. Siempre que programamos una línea de base de 
elementos múltiples, sometemos deliberadamente la conducta al control de múltiples variables. 
Si estamos interesados en estudiar los efectos de una operación sobre cada elemento de la línea 
de base por separado, debemos asegurarnos de que no hay interacciones importantes entre las 
variables que controlan a dichos elementos. Por ejemplo, podemos someter ambas conductas, la 
de evitación de shocks y la reforzada con comida, a un control por estímulos separado, y 
programar cada una de ellas como elemento de una línea de base múltiple. Pero, ¿en qué medida 
es adecuado el control por estímulos? ¿Son los dos elementos de la línea de base realmente 
independientes entre sí, o, por el contrario, la conducta de un elemento depende hasta cierto 
punto de las variables que se supone que controlan solamente a la conducta del otro elemento? 
El problema se complica todavía más cuando los elementos de la línea de base se programan 
concurrentemente. En este caso, las variables que controlan cada elemento de la línea de base en 
cuestión se hallan presentes al mismo tiempo, debido a lo cual resulta problemático averiguar si su 
control puede encauzarse independientemente hacia aspectos distintos de la conducta del 


organismo. 
Con el conocimiento de que disponemos, las respuestas a estas preguntas deben ser 
estrictamente empíricas, y lo que importa es que se disponga de técnicas adecuadas para 


determinar dichas respuestas en un caso concreto. Los datos que poseemos actualmente nos 
indican que se observarán interacciones en algunos casos, aunque no son inevitables. Los factores 
causantes de la independencia o de la interacción entre los componentes de una línea de base de 
elementos múltiples todavía están por identificar. 


Sin embargo, no debemos confinar sólo nuestro interés en dichas interacciones al problema de su 
eliminación. El control simultáneo de la conducta ejercido por un elevado número de variables, 
puede resultar un estorbo cuando deseemos emplear una línea de base de elementos múltiples 
como medio para estudiar los efectos de una operación sobre cada elemento por separado de la 
línea de base. Por otra parte, el estudio deliberado de este control múltiple constituye, en sí 
mismo, un problema de investigación que debe ser atacado. La conducta se halla, de modo 
característico, bajo el control múltiple de variables que se interaccionan, y cualquier estudio 
sistemático, ya sea descriptivo o teórico, debe tener en cuenta dichas interacciones para que 
resulte adecuado. Además, como subproducto de este estudio independiente, obtendremos 
información que nos permitirá evaluar la precisión del control ejercido en una línea de base dada 
de elementos múltiples. Las técnicas para comprobar esta precisión son las mismas que las que se 
deben usar para estudiar deliberadamente los efectos de interacción. 


¿Cómo se diseñan experimentos para estudiar el control simultáneo de la conducta ejercido por 
una multiplicidad de variables? La primera tarea del experimentador consistirá en determinar si el 
procedimiento que ha adoptado ejerce realmente dicho control múltiple. 


Supongamos que le procedimiento en cuestión es una línea de base de elementos múltiples, cada 
uno de los cuales se halla bajo un control por estímulos independientes. Un modo de comprobar la 
existencia de interacciones entre los elementos es llevar a cabo experimentos de control en que 
cada componente aparezca por separado. De este modo puede hacerse una comparación entre un 
elemento dado cuando se programa por sí solo, y cuando se programa como componente de un 
procedimiento múltiple. Si, por ejemplo, el procedimiento en cuestión es un programa múltiple de 
intervalo fijo y razón fija, podríamos llevar a cabo procedimientos de control de intervalo fijo y de 
razón fija separadamente, y observar si difieren de cuando se aplican en combinación. 


Este control podría parecer el más directo y satisfactorio. En realidad, sólo constituye el primer 
paso, y, considerado aisladamente, dista mucho de ser adecuado. Aunque nos ayudará a 
determinar si los componentes conductuales mantienen sus características generales al 
programarse en yuxtaposición temporal bajo un control por estímulos separado, pueden darse 
todavía, sin embargo, interacciones cuantitativas que sólo se podrán observar mediante una 
manipulación experimental deliberada. 


Supongamos, por ejemplo, que alteramos cuantitativamente un parámetro de uno de los 
componentes de un programa múltiple. Cambiemos el valor de la razón fija de 50 a 200 respuestas 
por reforzamiento. Podemos esperar con seguridad un cambio en la conducta de razón, pero lo 
que importa saber aquí es sí también cambiará la conducta de intervalo fijo. Si así sucede, 
deberemos concluir que nuestros dos componentes no son independientes entre sí, y que la 
conducta de intervalo está controlada tanto por las contingencias de intervalo como por las de 


razón. Tal vez no se hubiese observado este fenómeno programando los dos componentes 
independientemente. 


He aquí, pues, nuestro segundo método para comprobar la existencia de un control simultáneo 
ejercido por más de una variable. El primero se basaba en una verificación independiente; 
el segundo consiste en una manipulación funcional. Este segundo método no constituye 
solamente una técnica para identificar los efectos de interacción, sino que es a la vez el medio 
principal para investigarlos más a fondo. Variando los parámetros de control, podemos llegar a 
una descripción cuantitativa del espectro de interacción. Aparte de esta información básica, 
valiosa por sí misma, quizás podemos determinar también un intervalo de valores paramétricos a 
lo largo del cual haya poca o ninguna interacción. Si para otros fines nos interesa establecer una 
línea de base de elementos múltiples libre de efectos de interacción, podremos seleccionar los 
valores paramétricos adecuados en dicho intervalo. 


La manipulación funcional también nos proporcionará una base inductiva para identificar los 
procesos responsables de los procesos de interacción. Observemos ahora, más detalladamente, 
nuestro programa múltiple de intervalo fijo y de razón fija. Los elementos de este programa 
pueden disponerse siguiendo un cierto número de posibles secuencias. Supongamos que hemos 
seleccionado una pauta en la que los dos programas, junto con sus estímulos asociados, se 
alternan después de cada reforzamiento. Aplicando la técnica de manipulación funcional, 
aumentamos sistemáticamente la magnitud de la razón fija. Supongamos que, a medida que 
aumenta el tamaño de la razón, no sólo se altera la conducta de razón sino que también 
observamos que la tasa global del componente de intervalo fijo decrece sistemáticamente. 


Esta observación puede dar lugar a varias, conclusiones, pero sólo elegiré una de un modo 
arbitrario. Podemos hacernos la pregunta: “¿Qué procesos pueden ser los responsables de la 
interacción entre la magnitud de la razón y la conducta del programa de intervalo?” Después de 
examinar el procedimiento utilizado, vemos una posible respuesta a esta pregunta. La conducta 
emitida en presencia del estímulo correspondiente al programa de intervalo, no sólo consigue 
comida según los requerimientos del intervalo fijo, sino que también consigue la aparición del 
estímulo asociado al programa de razón. Podemos preguntarnos si la conducta de intervalo resulta 
controlada por sus dos consecuencias, el reforzamiento con comida y el programa de razón a la 
vez. En un caso así, el aumento del tamaño de la razón podría ocasionar la disminución del valor 
reforzante de esta combinación de consecuencias, lo cual tal vez explicaría la reducida tasa global 
de intervalo fijo. 


Aquí empieza, pues, una nueva serie de experimentos. Una variación del procedimiento original 
podría consistir en intercalar un período de time-out entre cada componente. Esto proporcionaría 
una separación temporal entre el programa de intervalo y el de razón, y mantendría constantes las 
consecuencias inmediatas de la conducta de intervalo aún en el caso de que se variara la magnitud 
de la razón. De este modo, quizá no tuviera ningún efecto sobre la conducta de intervalo un 
aumento de la razón. 


Otro procedimiento podría consistir en alternar los programas sólo después de cada dos 
reforzamientos. Obtendríamos así series alternadas constituidas por dos elementos de razón, dos 
de intervalo, y así sucesivamente. Ello mantendría un conjunto de consecuencias constantes para 
la conducta de intervalo emitida bajo el primer período de cada par, mientras que el segundo 
intervalo del par probablemente mostraría los efectos perturbadores de una magnitud de la razón 
aumentada. Si deseamos continuar reduciendo la interacción entre la razón y el intervalo, 
podríamos cambiar la pauta de alternancia todavía más drásticamente, pasando de un programa a 
otro, por ejemplo, una vez cada diez reforzamientos. 


Si estas manipulaciones consiguen el resultado esperado, no sólo habremos identificado una 
fuente de determinación múltiple de la conducta, sino que habremos descubierto el modo de 
eliminar las interacciones. Ello constituye tal vez la principal ventaja de la manipulación funcional 
sobre un análisis estadístico de los efectos de la interacción. Ello constituye tal vez la principal 
ventaja de la manipulación funcional sobre un análisis estadístico de los efectos de la interacción. 
Las técnicas estadísticas —el análisis de la varianza, por ejemplo- pueden indicar como máximo la 
existencia de interacciones en un determinado conjunto de datos. La manipulación funcional no 
sólo proporciona esta información con mayor detalle. Sino que también cumple con los objetivos 
mucho más avanzados del control experimental y la compresión sistemática de las interacciones 
en cuestión. 


El método de la manipulación funcional nos indicará si es imposible, tal como con frecuencia 
puede ocurrir, eliminar las interacciones existentes entre distintas variables bajo cuyo control se 
halla la conducta. En un caso así, debemos aprender a aceptar la conducta tal como se nos 
presenta. Si se observa que dos o más variables se hallan entremezcladas de un modo inextricable 
en su control de la conducta de un individuo, habremos descubierto un fenómeno de la 
naturaleza. Nuestra única solución será investigar la interacción observada por medio de 
manipulaciones funcionales, de modo que su magnitud e intrincación se hagan patentes bajo una 
gran variedad de situaciones. Si la conducta que se halla bajo observación experimental está 
controlada simultáneamente por dos o más variables, ningún tipo de manipulación estadística 
puede inmovilizar ninguno de los factores que embrollan la situación. El control estadístico de la 
causalidad múltiple es un ardid para manipular la conducta verbal del experimentador, puesto que 
no tiene ningún efecto sobre la conducta del sujeto experimental. 


Dos o más variables pueden resultar inseparables en la naturaleza, o pueden haber sido 
combinadas deliberadamente por el experimentador interesado en la causalidad múltiple. En este 
último caso, puede ser deseable utilizar un diseño experimental que permita una evaluación 
continuada de la interacción, con respecto a una línea de base en que cada una de las variables 
que la controlan actúe independientemente. Supongamos que queremos investigar la conducta 
que se halla bajo el control simultáneo de una contingencia de evitación de shocks y un programa 
de reforzamiento con comida de intervalo variable. Un modo de lograrlo sería programar los dos 
procedimientos concurrentemente, de modo que una respuesta dada cumpliera con las funciones 
simultáneas de evitar el shock y de obtener comida. Para ello, deberíamos manipular algunas de 
las variables que se sabe que son relevantes cuando cada uno de estos tipos de control actúa 


independientemente del otro. Empecemos, pues, con la intensidad del shock, y supongamos que 
observamos, en general, que a un aumento de intensidad del shock corresponde también un 
aumento en la tasa de respuesta. Nos interesará saber luego si la magnitud de dicho incremento 
en la tasa se haya condicionado de algún modo por la presencia del programa de intervalo variable 
concurrente. Podremos investigar, a continuación, si la respuesta conductual a los cambios de 
intensidad del shock viene regida por una interacción con el programa de reforzamiento con 
comida de intervalo variable, o bien si esta respuesta es simplemente la misma que la que se 
observaría en el caso de que la contingencia de evitación se programara por separado. 


Quizá sería posible solucionar este problema utilizando nuestro procedimiento concurrente como 
uno de los elementos de una línea de base múltiple sometida a un control por estímulos. La línea 
de base múltiple sometida a un control por estímulos. La línea de base múltiple estaría formada, 
pues, por tres componentes: el programa de intervalo variable aislado, la contingencia de 
evitación igualmente aislada, y ambos procedimientos experimentales programados 
concurrentemente. Cada uno de estos tres elementos se hallaría correlacionado con su propio 
estímulo. Podríamos luego variar la intensidad del shock y observar sus efectos sobre cada 
componente de la línea de base. 


Dado que este experimento, que yo sepa, no se ha llevado a cabo, puedo especular libremente 
sobre sus posibilidades. Quizá observáramos, al aumentar la intensidad del shock, que la tasa de 
respuesta se incrementa en presencia del elemento concurrente de la línea de base múltiple. 
Supongamos que este cambio es varias veces mayor que el aumento que asimismo experimenta la 
tasa de respuesta ante el componente de evitación aislado. Ello indicaría, ciertamente, que el 
efecto de la intensidad del shock en el elemento concurrente está influido por una interacción con 
el programa de intervalo variable que lo acompaña. 


También deberemos examinar el componente de intervalo variable de esta línea de base múltiple, 
y todo lo que aquí podamos observar será de gran interés. Si la tasa de respuesta de intervalo 
variable no muestra aisladamente ningún cambio en función de la intensidad del shock, se nos 
plantearía una peliaguda cuestión: ¿cómo puede, en un caso como éste, el programa de intervalo 
variable aumentar la sensibilidad de la conducta de evitación a los cambios que se produzcan en la 
intensidad del shock? 


Si, por otra parte, la tasa de respuesta de intervalo variable disminuyera a medida que 
aumentásemos la intensidad del shock, tendríamos un posible indicio en cuanto a la naturaleza de 
la interacción que existe en el elemento concurrente. Un resultado de este tipo sugeriría que el 
programa de reforzamiento de intervalo variable actúa de freno sobre la tasa de respuestas de 
evitación concurrente cuando las intensidades de shock son bajas, pero que esta acción de frenad 
queda eliminada cuando intensidades de shock más altas hacen disminuir la tasa de intervalo 
variable. Podríamos continuar luego comprobando esta suposición de otras maneras. 


El tercer resultado posible sería un aumento en la tasa de respuestas emitidas en presencia del 
componente de intervalo variable. En este caso, deberíamos atribuir el aumento en la tasa de 
respuestas emitidas en presencia del elemento concurrente a un proceso de acumulación, o tal 


vez a una función más compleja, de los cambios observados en presencia de los dos componentes 
aislados de la línea de base. 


Podría continuar sugiriendo otras posibilidades de este tipo, pero a estas alturas ya resultarán 
evidentes al lector que se haya percatado debidamente de lo que se ha venido exponiendo hasta 
aquí. En cualquier caso, no persigo el propósito de proporcionar al estudiante un tema para su 
tesis doctoral. Simplemente intento sugerir una metodología experimental para atacar el 
problema planteado por la interacción simultánea entre distintas variables. El éxito de este 
método depende de la disponibilidad y utilización de una tecnología conductual que permita un 
control preciso de la conducta individual. Además, no se trata de un diseño experimental dirigido a 
proporcionar respuestas conclusivas. Tal como nuestro ejemplo ha demostrado, casi todos los 
resultados que con él se obtengan requerirán una investigación más a fondo. Dicho método 
constituye, pues, un procedimiento que será considerado especialmente idóneo por aquellos 
experimentadores que deseen ampliar su área de conocimiento en lugar de anquilosarse. 


XII. Técnicas de control 


El tema del control experimental no es de ningún modo independiente de lo que se ha venido 
discutiendo en los capítulos precedentes, y ya me he referido a él en muchas ocasiones. 
Las técnicas de control son de gran importancia en cualquier discusión general sobre la evaluación 
de datos, así como en los problemas de replicación, variabilidad y diseño experimental. 
El estudiante quizá se haya dado cuenta, sin embargo, tanto en este libro como en otras lecturas, 


p” 


que el término “control” no siempre se le confiere el mismo significado. Por ejemplo, me he 
referido a menudo a la necesidad, por parte del investigador, de procurar un grado de control 
experimental tan estricto como sea posible de la conducta individual que constituye su objeto de 
estudio. En este sentido, el control experimental se refiere a la habilidad del experimentador para 
manipular la conducta de un sujeto individual de una manera precisa y fiable. La posibilidad de 
hacer aparecer y desaparecer algún aspecto cuantitativamente consistente de la conducta por 
medio de la manipulación de variables especificables, demuestra un alto nivel de control. 
De manera parecida, poder variar de un modo fiable algún aspecto de la conducta a lo largo de 


una serie gradual de estados diferentes, implica un grado de control aún más elevado. 


También se requiere la desarrollada tecnología conductual implícita en este uso del término 
“control”, cuando dicho término se emplea con un segundo significado igualmente importante. 
Así, solemos hablar de “experimentos de control” u “observaciones de control”. En este sentido 
nos referimos a las técnicas utilizadas para determinar si nuestros resultados experimentales se 
deben realmente a nuestras manipulaciones explícitas, o bien si, por el contrario, resultan de los 
efectos ejercidos por otros factores desconocidos o cuya existencia ni tan solo se sospecha. Si, por 
ejemplo, introdujera una nueva variable y observáramos un cambio en la línea de base en curso, 
podríamos preguntarnos si se hubiera producido el cambio, de todos modos, en aquel punto, aun 
en le caso de que no hubiéramos alterado las condiciones experimentales. Para comprobar esta 
posibilidad, quizás llevaríamos a cabo un experimento de control. También podríamos 
preguntarnos si una determinada observación resulta, únicamente, de nuestras operaciones 
experimentales del momento, o bien si también ha influido en ella la historia conductual del 
organismo. Para verificar esta posibilidad, efectuaríamos experimentos de control utilizando 
sujetos que poseyeran historias conductuales diferentes. 


El control experimental se refiere, pues, a nuestra capacidad de manipular la conducta. 
El experimento de control, por otra parte, denota una técnica para poner a prueba nuestra 
comprensión de las manipulaciones que hemos llevado a cabo. ¿Podemos estar seguros de que 
nuestros datos resultan de nuestras manipulaciones experimentales deliberadas, o se deben 
también a otros factores? ¿Qué tipos de variables es probable que den al traste con nuestra labor, 
conduciéndonos a conclusiones no fiables? 


El estudiante debería tener presente en todo momento que el control experimental es tan básico 
a nuestra comprensión de la conducta como lo es a la manipulación de la misma. 
Una manipulación hábil es el método más productivo para acrecentar dicha comprensión. 


Debido a esta relación, ya me he referido repetidas veces a las técnicas de control, y, por lo tanto, 
sólo incluiré aquí aquellos problemas que plantean las técnicas de control que no se discutieron 
apropiadamente en otros contextos. 


NORMALIZACIÓN DE TÉCNICAS 


Con mucha frecuencia no surge, o no se reconoce, la necesidad de llevar a cabo experimentos de 
control hasta que otro investigador descubre que no puede replicar los hallazgos originales. 
Dando por sentado que tanto un experimento original como el intento de replicación se llevaron a 
cabo de un modo competente, suele buscarse la razón de la discrepancia en las diferencias 
existentes entre las técnicas empleadas. 


Quizás un investigador utilice un mecanismo administrador de comida en el que la bandeja vacía 
permanece accesible al sujeto entre reforzamientos, mientras que el otro investigador le retira del 
alcance del sujeto inmediatamente después de cada reforzamiento. Del mismo modo, en un 
laboratorio determinado puede ser costumbre emplear una corriente de shock de intensidad 
constante, mientras que en otro se prefiera mantener constante el voltaje. Pueden haber 
diferencias en el tipo y tamaño de los reforzadores, en el tipo de interruptor incorporado al disco 
de respuestas, en la duración de las sesiones experimentales, en el modo de terminar cada sesión 
(por ejemplo, basándose en un criterio temporal fijo o bien en un número fijo de reforzamientos), 
en el tamaño del recinto experimental, así como en muchos otros detalles de las técnicas de 
investigación. 


En ocasiones se mantiene que este tipo de detalles técnicos, aun admitiendo su importancia, no 
tienen mucho que ver con las principales metas de la investigación conductual, suponiéndose que 
son específicos de ciertos procedimientos de laboratorio sin ningún valor como principios 
conductuales generalizables. Los experimentos de control precisados por las variaciones en los 
detalles más sutiles de la técnica experimental se consideran un derroche de tiempo y de esfuerzo. 
En ocasiones se sugiere que para eliminar esta costosa confusión, la técnica experimental utilizada 
en una determinada área de investigación se normalice. Debería, por lo tanto, llegarse a un 
acuerdo acerca de un conjunto de convenciones a seguir por todos los investigadores que trabajan 
en esta área. 


Uno de los puntos de partida que se han sugerido para la normalización de cualquier aspecto de 
una técnica, es que ésta proporcione el más alto nivel posible de control conductual. El disco de 
respuestas, por ejemplo, debería caracterizarse por un grado de sensibilidad, configuración física, 
y localización dentro del registro experimental que, de un modo eficaz, redujera al mínimo la 
conducta incompatible, conducta que de otro modo interferiría con la respuesta registrada. 
Asimismo, debería adoptarse un reforzamiento con comida normalizada, cuya composición 
permitiera subsistir, gozando de buena salud, a los animales de una determinada especie, 
únicamente con los reforzamientos que obtuvieran en cada sesión experimental. 
Una normalización de este tipo permitiría un control riguroso del peso de un animal, constante de 


un laboratorio a otro. También reduciría al mínimo cualquier variabilidad debida al reforzamiento 
de conductas no especificadas, emitidas en el ambiente de la caja en que se halla el sujeto entre 
sesiones experimentales consecutivas. 


Hay mucho que decir en favor de la normalización de las técnicas experimentales. El estudiante 
debería considerar con detenimiento la posibilidad de normalización, antes de lanzarse con 
detenimiento la posibilidad de normalización, antes de lanzarse a diseñar aparatos y 
procedimientos originales, ya que de este modo se ahorrará y ahorrará a los demás una 
considerable cantidad de trabajo, que de lo contrario debería emplearse en experimentos de 
control para reconciliar las diferencias entre sus datos y los obtenidos por otros en investigaciones 
afines. Del mismo modo, debería prestar especial atención a aquellos aspectos de las técnicas que 
son comunes a muchos problemas experimentales. Si es necesario, deberá visitar o mantener 
correspondencia con investigadores cuyo trabajo haya demostrado su competencia técnica, y 
obtener de ellos las especificaciones precisas para la normalización. 


Las técnicas experimentales que no están normalizadas retrasarán, a la larga, el progreso de 
cualquier ciencia experimental. No puede haber una gran continuidad de desarrollo si cada 
experimentador trabaja aislado, rigiéndose únicamente por su propia habilidad y limitado por el 
material de que dispone: alambres, cordeles y otras piezas diversas de aparatos abandonados en 
el almacén del laboratorio. La psicología sufre, en estos momentos, un caos de este tipo, tal como 
lo demuestra el considerable espacio que se dedica en las revistas especializadas a las 
controversias, experimentos de control y minucias de procedimientos que son una consecuencia 
directa de técnicas sin normalizar. 


Sin embargo, existen algunos poderosos argumentos en contra de la normalización. ¿Disponemos 
de la información suficiente sobre la eficacia relativa del gran número de variaciones posible de 
cualquier técnica experimental? Hasta el presente ha habido poca exploración sistemática de estas 
variaciones. En muchos casos se han adoptado variantes de una técnica por razones difíciles de 
especificar, y que se basan simplemente en el conocimiento práctico que se acumula en cada 
laboratorio, formado por observaciones incompletas, corazonadas e incidentes históricos. Debido 
a ello, un laboratorio empleará un disco de respuestas tan sensible que casi funcionará soplando 
sobre él, mientras que en otro laboratorio todos los discos se construirán de modo que requiera al 
menos un centímetro de recorrido antes de llegar a cerrar el interruptor. Al establecer una línea 
de base de intervalo fijo, un conjunto de investigadores empezará a contar cada intervalo a partir 
de una respuesta reforzada, mientras que otro grupo fijará los intervalos con la única ayuda de un 
reloj, independientemente de la conducta del sujeto. Aquellos que arguyen en contra de la 
normalización de las técnicas, alegan el desconocimiento general sobre cuál de éstas u otras 
variaciones similares permiten un control más efectivo, concluyendo que la normalización 
resultaría demasiado prematura. 


¿En qué posición coloca este estado de cosas al estudiante? Deseoso de empezar una 
investigación con la cual espera aprender algo sobre la conducta, quizás se muestre reticente a 
desviar sus esfuerzos hacia problemas técnicos. La solución a este dilema deberá ser intermedia, 


dado que a menos que el estudiante esté trabajando en un área en que no existan precedentes, 
sería disparatado no tomar modelo de aquellas técnicas cuya utilidad ha sido sobradamente 
demostrada. Por otra parte, la experiencia personal con un cierto número de variaciones técnicas 
constituye un método comprobado para proporcionar al investigador la madurez de juicio 
requerida para una evaluación adecuada de sus propios datos y de ajenos. Todo estudiante 
debería, por tanto, pasar algún tiempo como aprendiza de técnicas antes de emprender su carrera 
de investigador, y si sus maestros no le proporcionan explícitamente este aprendizaje, debería 
llevarlo a cabo por iniciativa propia. Este período de aprendizaje no sólo debería proporcionar al 
estudiante alguna noción en cuanto al grado de estandarización técnica a que puede llegar, sino 
que también debería imbuirle de una actitud escéptica permanente en lo que toca a las técnicas. 
Dicho en otras palabras, el estudiante debe tener muy presente que, mientras que algunos 
aspectos de sus propias técnicas y de las utilizadas por otros se basan firmemente en los hechos o 
en principios generales relativamente sólidos, otros aspectos se derivan simplemente de la 
experiencia adquirida en el laboratorio. Mientras que los primeros permanecerán estandarizados, 
los segundos probablemente irán evolucionando. La solución intermedia a que me he referido 
consiste, pues, en estandarizar una técnica tanto como sea posible, a fin de mantener la 
continuidad experimental dentro del área en que se aplique, aunque manteniéndose preparado 
para adoptar los avances técnicos tan pronto como nuevos hechos los impulsen. 


Mediante esta actitud prudente y escéptica, también es posible enfrentarse a una segunda 
objeción planteada a la normalización de técnicas. Las variaciones en las técnicas con frecuencia 
dan lugar a datos que resultan de importancia dentro de un contexto sistemático, y suele 
objetarse que su normalización puede impedir, o al menos retrasar, la obtención de dichos datos. 


Por ejemplo, mediante la aplicación de una técnica de reforzamiento que ahora reconozco 
insuficiente, pude observar por primera vez la implicación accidental de una respuesta reforzada 
con comida en una contingencia de evitación. Esta observación se realizó en el contexto de un 
procedimiento de dos respuestas concurrentes, en el que se utilizaban monos como sujetos. 
Una respuesta era mantenida mediante un reforzamiento con zumo de naranja azucarado, que se 
ponía a disposición de los sujetos bajo un programa de intervalo variable de cuatro minutos. 
Una segunda respuesta, que se podía emitir al mismo tiempo, tenía la misión de evitar un shock. 


Los factores que mantenían la respuesta reforzada con comida ejercían un control muy pobre, tal 
como lo demostró el hecho de que se produjera una baja e irregular tasa de respuestas reforzadas 
con comida cuando la conducta de evitación era extinguida. Sin embargo, cada vez que se volvía a 
introducir de contingencia de evitación de shocks, la conducta reforzada con comida también 
aumentaba su tasa y regularidad, debido al control relativamente poderoso ejercido por la 
contingencia de evitación sobre la segunda respuesta. 


Una investigación más detenida reveló que la respuesta reforzada con comida había caído 
accidentalmente bajo el control ejercido por la contingencia de evitación, y se había convertido, 
de un modo difícil de detectar por parte del investigador, en un componente de la conducta de 
evitación (ver páginas 223-227).un estudio adicional indicó que si hubiese utilizado un refuerzo 


más eficaz que el zumo de naranja, y hubiera usado un programa que proporcionase 
reforzamientos con una frecuencia mayor que uno cada cuatro minutos, este fenómeno nunca 
hubiese llegado a producirse. En lugar de ello, la respuesta de evitación se hubiera convertido en 
un componente de la conducta reforzada con comida, lo cual constituye un fenómeno de gran 
interés aunque distinto, que ya había sido observado en varios laboratorios. 


La normalización de una técnica basándose solamente en un alto grado de control experimental 
puede, por lo tanto, impedir automáticamente la observación de importantes fenómenos 
conductuales. Las variables que resultan inmovilizadas por las especificaciones técnicas pueden 
demostrar ser parámetros significativos de un proceso conductual. Se sabe que una baja 
deprivación, por ejemplo, permite solamente un control experimental débil, debido a lo cual la 
mayor parte de investigadores rehúyen su estudio. Sin embargo, la conducta de los sujetos con 
una deprivación baja puede revelar la existencia de nuevos fenómenos que quizás exijan cambios 
radiales en nuestra descripción sistemática de la conducta. 


La solución a este problema, en la medida en que exista, no reside en el abandono de la 
normalización de técnicas. Por le contrario, requerirá la adopción de una base más flexible para 
normalizarlas. El rigor de control experimental constituirá aún el criterio más importante, pero el 
nivel de control debe evaluarse en términos de los objetivos que pretende conseguir un 
experimento dado. Si se desean investigar los fenómenos asociados a un control conductual débil, 
la única posibilidad es la de seguir las prácticas generalmente aceptadas, y si de este modo se 
descubre una nueva área de investigación, la técnica que se aplique dentro de dicha área 
evolucionará gradualmente hacia su propia normalización. Incluso si una desviación de las 
prácticas comunes no dan lugar a nuevos hallazgos, este intento proporcionará una evidencia 
directa a favor o en contra de la conveniencia de normalizar un aspecto particular de la técnica en 
cuestión. Sabremos entonces si una determinada variable es de interés general o solamente 
técnico. Sin embargo, deberíamos estar siempre preparados para descubrir que un aspecto 
técnico, considerado inamovible hasta aquel momento, controla en realidad un cierto número de 
fenómenos conductuales altamente informativos y sugerentes. 


Factores tales como la deprivación o la saciedad, tamaño y tipo de reforzamiento, sensibilidad del 
disco o de la palanca, tamaño del recinto experimental, etc., se hallan comúnmente sujetos a 
técnicas de control explícitas. Sin embargo, existe un cierto número de variables a las que se ha 
dedicado relativamente poca atención experimental, y que, por consiguiente, no se considera, por 
lo general, que requieran un control deliberado. Estas variables constituyen las regiones 
fronterizas de nuestro conocimiento empírico. Hay suficiente evidencia, tanto publicada como 
inédita, para sugerir que dichas variables no sólo requieren la aplicación de técnicas de control, 
sino que su investigación intensiva resultará altamente fructífera. Es precisamente esta 
investigación la que pondrá al descubierto las técnicas de control más eficaces, y al mismo tiempo 
perfilará las situaciones concretas en que sea necesario utilizarlas. Mientras tanto, merecerá la 
pena señalar algunas de estas variables fronterizas e indicar sus potenciales requerimientos de 
control. 


REFORZAMIENTO ACCIDENTAL 


A pesar de los muchos intentos de deducirlo racionalmente, el principio de reforzamiento 
continúa siendo un enunciado empírico. La observación experimental básica consiste en haber 
demostrado la existencia de acontecimientos que, cuando son contingencias a una respuesta, 
aumentan la probabilidad de emisión de dicha respuesta. La identificación de las condiciones 
concretas bajo las cuales dichos acontecimientos tendrán una función reforzadora, ha constituido 
una de las principales preocupaciones del psicólogo experimental durante los últimos veinticinco 
años o más. 


Para el propósito que persigo aquí, podemos concentrarnos en un aspecto del enunciado empírico 
que, generalmente, no suele tenerse en cuenta. Es preciso hacer notar que. En él, no se hace 
referencia ni a la intención del sujeto ni, todavía más importante, a la intención del 
experimentador. El modo en que opera un acontecimiento reforzador es automático. Siempre que 
un acontecimiento de este tipo se produzca en relación adecuada a la conducta, ejercerá su efecto 
reforzante, independientemente de si el investigador ha incluido o no este efecto en su diseño 
experimental, e idependientemente también de si se registra o no la conducta afectada por él. 


Una demostración pionera de la acción automática de los acontecimientos reforzadores, fue 
llevada a cabo por B. F. Skinner.* Debido tal vez a su intrigante título, “Superstición” en la 
paloma”, las implicaciones no científicas que el artículo de Skinner tenía para las técnicas de 
control experimental no fueron inmediatamente reconocidas por la mayoría de investigadores. 
La demostración era muy simple. Se colocaban palomas hambrientas en un espacio experimental, 
permitiéndoles acceso a la comida durante unos pocos segundos de un modo periódico. No se 
exigía ninguna conducta particular por parte de las palomas para que éstas pudiesen recibir la 
comida. Después de dejar las palomas en esta situación durante toda una noche, cuando Skinner 
regresó a la mañana siguiente las encontró emitiendo distintas pautas estereotipadas de conducta 
perfectamente definidas. 


Una paloma resultó condicionada de modo que giraba en el sentido contrario a las agujas de un reloj dentro 
de la jaula, llevando a cabo dos o tres giros entre cada dos reforzamientos consecutivos. Otra, metía la 
cabeza repetidamente en uno de los ángulos superiores de la jaula. Una tercera desarrolló una conducta de 
“corcovear”, como si colocara su cabeza debajo de una barra invisible y la levantara repetidas veces. Otras 
dos palomas efectuaban un movimiento de péndulo con la cabeza y el cuerpo, mediante el cual extendían la 
cabeza hacia adelante y la balanceaban de derecha a izquierda con un movimiento brusco, seguido por un 
retorno al punto de partida algo más lento. Su cuerpo seguía el movimiento de un modo general, e incluso 
daban unos pocos pasos en los momentos en que el balanceo era muy acusado. Otra paloma quedó 
condicionada para dar unos picotazos incompletos mediante pequeños movimientos rápidos dirigidos hacia 
el suelo de la jaula, aunque son tocarlo... 


El proceso de condicionamiento resulta obvio en la mayoría de los casos. La paloma se halla emitiendo 
algunas respuestas en el momento en que aparece la tolva de grano; como resultado de ello tiende a repetir 
la respuesta. Si el intervalo que transcurre antes del próximo reforzamiento no es lo suficientemente largo 


para que se produzca la extinción, es probable que se produzca una segunda “contingencia de 
reforzamiento”, lo cual fortalece la respuesta todavía más, aumentando así la probabilidad de que tenga 
lugar un reforzamiento subsiguiente (82, página 168). 


En los últimos años, han sido cada vez más frecuentes las observaciones de fenómenos 
íntimamente relacionados con aquellos que Skinner describió. El reforzamiento que fortalece la 
conducta sin que haya ninguna relación causal entre ambos elementos, se ha denominado 
“reforzamiento accidental”. Este fenómeno ha resultado útil para ayudar a explicar formas de 
conducta, al parecer tan diversas, como las perturbaciones neuróticas psicóticas, así como para la 
elaboración científica de una teoría. Ambas formas de comportamiento suelen caracterizarse por 
correlaciones accidentales entre la conducta y los acontecimientos reforzadores subsiguientes. 
Por más fascinante que esta línea de investigación pueda parecer, nuestro interés presente se 
centra, sin embargo, en las implicaciones que para las técnicas de control pueda tener el 
reforzamiento accidental. Hay un cierto número de situaciones experimentales concretas en que 
se ha demostrado que el reforzamiento accidental ejerce un efecto que, de no controlarse, puede 
perturbar considerablemente nuestra evaluación de los datos resultantes. 


EXPERIMENTOS DE DISCRIMINACIÓN 


A menudo resulta deseable someter una muestra de conducta a un control por estímulos, ya sea 
por razones técnicas, como en el caso de una línea de base de elementos múltiples, o bien con 
objeto de investigar los procesos implicados en el control por estímulos en cuestión. Quizás 
estemos interesados en la naturaleza de dicho control, tal como ocurre en los experimentos de 
generalización; en el proceso de evolución del control por estímulos, como en los experimentos de 
discriminación; en relaciones entre determinadas dimensiones de estímulos y capacidad sensorial, 
como en los experimentos psicofísicos, y, finalmente, en concomitantes fisiológicos del control por 
estímulos, puestos de manifiesto, por ejemplo, por un registro electrofisiológico llevado a cabo 
simultáneamente. Todos estos tipos de experimentos dan por sentado que los estímulos en 
cuestión ejercen, de hecho, algún grado de control sobre la conducta. Sin embargo, no basta 
simplemente con la suposición, sino que este control, así como el grado en que se ejerce, deben 
demostrarse. Quizás resulte imposible llevar a cabo esta demostración si no se reconoce que los 
estímulos discriminativos también ejercen funciones aversivas o reforzadoras condicionadas, y que 
estos efectos pueden contribuir, accidentalmente, a embrollar el control discriminativo que nos 
interesa de modo primordial. 


Un ejemplo siempre esclarecerá este punto. ¿Cuál es la demostración más inequívoca de que un 
estímulo dado controla la emisión de una muestra concreta de conducta? Esta demostración es el 
establecimiento de una línea de base en la cual la conducta deseada siempre aparece cada vez que 
se presenta el estímulo, y raramente se emite en su ausencia. Todo estudiante que ha pasado por 
un curso elemental de psicología experimental ha llevado a cabo esta demostración, o, en su 
defecto, le han indicado cómo realizarla; sin embargo, aquellos que hayan efectuado el 
experimento como parte de su programa de laboratorio, indudablemente recordarán, si se paran 


a pensarlo, cierto número de casos en que los resultados no fueron los esperados. 
Algunos sujetos, a pesar de que sólo se reforzaron en presencia de un determinado estímulo, 
nunca llegaron a abstenerse de responder por completo en ausencia de dicho estímulo. En otras 
palabras, no se llegó a establecer adecuadamente la discriminación. 


Si el ayudante de laboratorio que dirigía sus prácticas sabía lo que traía entre manos, 
probablemente aprovechó los resultados negativos para demostrar la acción del reforzamiento 
condicionado accidental. El estímulo discriminativo en estos experimentos suele ser presentado en 
momentos arbitrariamente elegidos, independientemente de la conducta en curso del sujeto. 
Este programa arbitrario de presentación de estímulos permite que ocasionalmente se produzcan 
correlaciones accidentales entre la respuesta registrada y el comienzo del estímulo. 


Considerémoslo ahora desde el punto de vista del sujeto. Supongamos que está empezando a 
aprender que una respuesta dada sólo se refuerza en presencia de un cierto estímulo cuando, 
inesperadamente, el estímulo aparece justamente después de haber emitido una de estas 
respuestas. Esencialmente, se halla en la misma posición que las palomas supersticiosas de 
Skinner. El hecho de que el estímulo hubiera aparecido de todos modos, aun sin emitir la 
respuesta, no tiene ninguna importancia, ya que la función reforzante condicionada del estímulo 
es independiente de las intenciones del experimentador. 


El resultado final es un aumento en la probabilidad de que dicha respuesta vuelva a ocurrir 
durante el próximo período sin estímulo, lo cual produciría un aumento correspondiente en la 
probabilidad de que la respuesta “ocasione” de nuevo la aparición del estímulo. El proceso se 
acelera, y si el propósito original era demostrar que la conducta se podía someter a un control por 
estímulos, el experimento resulta un fracaso, dado que es posible que dicha conducta se emita 
con igual frecuencia tanto en presencia como en ausencia del estímulo en cuestión. Si el 
experimentador no está enterado de la posibilidad de que se produzcan reforzamientos 
accidentales, puede llegar a la conclusión de que el sujeto es sordo, ciego o que por cualquier otra 
causa carece de capacidad de discriminación, debido a lo cual probablemente deseche los datos 
obtenidos con él. 


El reforzamiento accidental llevado a cabo por un estímulo discriminativo no constituye una forma 
de control conductual ni pasajera ni débil.*” La conducta puede mantenerse accidentalmente 
durante un período de tiempo indefinido, incluso por medio de un reforzador condicionado. 
Además, la conducta mantenida de este modo puede presentar todas las características que 
normalmente se observan cuando la contingencia es real. Si, por ejemplo, en el experimento 
citado, el período sin estímulo tiene una duración fija, la conducta reforzada accidentalmente se 
ajustará a una pauta de intervalo dijo. La figura 43 ilustra un caso de este tipo. El procedimiento 
que en él se siguió fue un programa múltiple, con períodos alternados de extinción (time-out) y 
reforzamiento de razón fija. Después de cada período de extinción de quince minutos, aparecía un 
nuevo estímulo, en cuya presencia se administraban tres reforzamientos, cada uno de los cuales 
se suministraba después de haberse emitido 50 respuestas. 


150 RESPUESTAS 


15 MINUTOS 


FIGURA 43. Segmentos de registro de la conducta de una rata bajo un programa múltiple en el que 
períodos de time-out de 15 minutos de duración alternaban con un programa de reforzamiento de 
razón fija. Las líneas horizontales separaban los registros correspondientes a la conducta de time- 
out de los correspondientes a la conducta de razón fija. (Datos amablemente cedidos por R. Hill.) 


En la figura destacan los codos de intervalo fijo, durante los períodos de extinción de quince 
minutos. La conducta emitida durante los períodos de extinción no sólo resulta reforzada 
accidentalmente por el estímulo asociado al reforzamiento de razón fija, sino que también se 
mantiene de modo característico con la periodicidad del estímulo. Todo ello ocurre no obstante el 
hecho de que las respuestas emitidas durante el período de extinción no tienen, en realidad, 
ninguna influencia en absoluto sobre la presentación del estímulo asociado al reforzamiento. 


Este empleo del poder que ostenta el reforzamiento accidental nos indica una posibilidad técnica 
de control aplicable en los experimentos de discriminación. Para que se demuestre el control 
discriminativo que ejerce un estímulo, no es necesaria la ausencia total de respuestas cuando 
dicho estímulo, no está presente. Si las dos funciones del estímulo, la discriminativa y la 
reforzadora, generan dos pautas temporales de conducta bien diferenciadas, habremos logrado 
nuestro propósito, y la figura 43 representará indudablemente una verdadera demostración del 
control por estímulo. 


Al diseñar un experimento de discriminación debería tomarse, por lo tanto, la precaución de 
disponer tanto el programa de reforzamiento primario como el programa de presentación del 
estímulo de tal modo que, aun en el caso en que se produjera una contingencia accidental, las 
pautas conductuales resultantes pudieran diferenciarse claramente en presencia y en ausencia del 
estímulo. Si por ejemplo tuviéramos que usar un programa de intervalo variable en presencia del 
estímulo, y variar a la vez, de un modo aleatorio, la duración de los períodos de extinción, quizá 
resultara de ello una serie de pautas conductuales indistinguibles entre sí en ambos componentes 
del programa múltiple. 


Un método conexo para tratar este problema consiste en programar una contingencia explícita 
entre la conducta y la presentación del estímulo asociado al reforzamiento positivo. En vez de 
intentar evitar el reforzamiento accidental para generar una pauta conductual característica en 
ausencia del estímulo, pude utilizarse la técnica de encadenamiento desarrollada por Ferster y 
Skinner. Esta técnica es nuestra arma más poderosa para demostrar e investigar el reforzamiento 
condicionado. También constituye un excelente método para demostrar el control por estímulos. 
El reforzamiento primario está a disposición del sujeto sólo en presencia de un estímulo dado, 
pero la presentación de este estímulo discriminativo también depende de la conducta del sujeto 
(reforzamiento condicionado). Los programas de reforzamiento primario y condicionado pueden 
diferir suficientemente para producir pautas conductuales distintas, demostrándose de este modo 
el control por estímulos. Los datos de la figura 43 podrían muy bien haberse obtenido de esta 
forma directa en lugar de confiar en una contingencia accidental. 


Una tercera técnica de control para tratar con los problemas planteados por el reforzamiento 
accidental en los problemas de discriminación resulta apropiada cuando, por una u otra razón, 
necesitamos una tasa de respuestas nula en ausencia del estímulo discriminativo. Esta técnica, 
atribuida a Page en su forma original, hace que la aparición del estímulo sea contingente a la 
ausencia de respuestas. Podemos programar un estímulo de modo que aparezca, por ejemplo, 
después de 15 minutos de extinción, pero sólo si no se ha emitido ninguna respuesta durante el 
minuto que precede a la presentación del estímulo. Cada respuesta emitida dentro de este 
decisivo período de 60 segundos, sólo sirve para posponer el comienzo del estímulo hasta que se 
cumpla la condición exigida de ausencia total de respuestas. 


Mediante esta técnica, el estímulo nunca puede aparecer antes de haber transcurrido 60 segundos 
desde el momento en que ha sido emitida una respuesta, con lo cual la posibilidad de que tenga 
lugar un reforzamiento accidental queda eliminada. Este método, sin embargo, no es distinto, en 
principio, del procedimiento experimental de encadenamiento. En ambos casos se aprovecha el 
efecto de reforzamiento condicionado del estímulo discriminativo. Un procedimiento utiliza es 
estímulo para reforzar la respuesta registrada: el otro lo utiliza para reforzar cualquier conducta 
que no sea dicha respuesta registrada. Ninguno de los dos procedimientos sería eficaz si el 
estímulo no fuera un reforzador condicionado. Por otra parte, tampoco sería necesario utilizar 
ninguno de los dos procedimientos si éste fuera el caso. 


Todas las técnicas de control mencionadas hasta el momento comparten, por lo tanto, la 
característica de que la conducta emitida en ausencia del estímulo discriminativo se halla todavía 
bajo el control de una contingencia de reforzamiento, ya sea deliberada o accidental. En algunos 
casos, dependiendo del propósito que se persiga, quizá este control no resulte deseable. Con una 
línea de base conductual como la que aparece en la figura 43, por ejemplo, podríamos estar 
interesados en el efecto que tendría la administración de un shock sobre el control discriminativo 
ejercido por el estímulo. Del mismo modo, podríamos estar interesados en estudiar los efectos de 
un fármaco sobre este control. Quizá se descubra que la administración de un shock o de un 
fármaco altera el codo de intervalo fijo, y hace que la conducta anterior al estímulo se parezca al 
componente de razón fija de la línea de base. ¿Podemos decir, en este caso, que nuestras 
operaciones experimentales han anulado el control discriminativo ejercido por el estímulo? Dicho 
de una manera menos rigurosa, ¿impide el shock, o el fármaco, que el sujeto vea la diferencia 
entre la ausencia y la presencia del estímulo? Esta conclusión sería demasiado precipitada. 
El efecto del shock o del fármaco tal vez haya sido simplemente específico de los codos de 
intervalo fijo, y quizás se hubiese observado el mismo resultado de haber introducido 
independientemente un programa de intervalo fijo, en ausencia de todo control ejercido por un 
estímulo discriminativo. Deberíamos, por lo tanto, llevar a cabo un estudio experimental sobre 
esta posibilidad, aun si el codo original hubiera sido generado y mantenido por un reforzamiento 
accidental. 


Sin embargo, puede resultar imposible realizar este estudio experimental. Hay una importante 
diferencia entre cualquier contingencia de reforzamiento expresamente programada y su 
contrapartida accidental. Esta diferencia da lugar a lo que podría constituir un problema de control 
insoluble, y justifica suficientemente, quizás, el diseño de experimentos dirigidos a reducir al 
mínimo el control accidental. Es éste un problema de reversibilidad potencial de un cambio 
producido experimentalmente en la conducta de línea de base. 


Si la conducta de línea de base es mantenida por una contingencia de reforzamiento 
expresamente programada, una operación experimental. Tal como la administración de un 
fármaco, puede alterar el grado de control ejercido por la contingencia en cuestión. Sin embargo, 
una vez que se haya disipado el efecto ejercido por la droga, puede esperarse que la contingencia 
de reforzamiento, dado que todavía se mantiene presente. Volverá a adquirir control sobre la 
conducta. Supongamos, por ejemplo, que generamos una línea de base de apariencia similar a la 
de la figura 43. Pero introduciendo deliberadamente el componente de intervalo fijo. En estas 
circunstancias un fármaco puede provocar la casi total desaparición de la conducta de intervalo 
fijo, debido a lo cual aumentará la duración de los intervalos. Sin embargo, la contingencia 
continúa estando presente, puesto que todavía se requiere la emisión de una respuesta para que 
aparezca el estímulo de razón fija. A medida que los efectos de la droga se disipan y la 
contingencia vuelve a prevalecer, podemos esperar que se reinstaure la pauta normal de intervalo 
fijo. 


Quizá nunca llegue a producirse una recuperación de este tipo so la contingencia de intervalo fijo 
era accidental en lugar de haberse programado deliberadamente. Aún si el fármaco demora las 


respuestas durante un intervalo mayor que el período de 15 minutos sin estímulos, el estímulo de 
razón fija aparecerá de todos modos, dado que nunca requirió la emisión de una respuesta para 
ello. La aparición del estímulo, sin ninguna correlación con la respuesta registrada, puede reforzar 
otras conductas, persistiendo así la nueva pauta. La conducta de intervalo original 
accidentalmente reforzada quizá nunca vuelva a emitirse durante los períodos sin estímulos. Se 
trata de un caso en el que un cambio transitorio en la conducta permite la entrada en operación 
de nuevas variables, impidiendo, por lo tanto, que se recupere la conducta de línea de base 
original. 


Las probabilidades de que tenga lugar un efecto irreversible de este tipo aumentan 
considerablemente cuando la conducta de línea de base está gobernada por factores que no se 
hallan bajo un control experimental deliberado. Las contingencias accidentales caen dentro de 
esta clase de factores que controlan la conducta. Si tales contingencias juegan un papel en un 
experimento dado, es probable que el investigador tenga la sensación de que la conducta de sus 
sujetos es misteriosa, fluctuando bajo fuentes invisibles, y frustrando todos los intentos de 
acorralarla en los sólidos lazos de la ciencia. 


EXPERIMENTOS SOBRE RESPUESTAS MÚLTIPLES 


Durante mucho tiempo, los investigadores de laboratorio han porfiado amigablemente (¡a veces!) 
con el investigador clínico, sosteniendo que el estudio de la conducta compleja será más 
provechoso a largo plazo si primeramente logramos una comprensión sistemática y un control 
técnico competente de fenómenos más simples. Y realmente sucede que, a medida que nuestro 
refinamiento sistemático t técnico aumenta, podemos traer al laboratorio procesos conductuales 
cada vez más complejos. Sin embargo, no por ello deberíamos llegar a la conclusión de que el 
estudio de procesos complejos se convierte así en un simple proceso de acumulación. Mientras 
que se comprueba que los principios simples se cumplen, y que la aplicación de las técnicas 
también simples facilita la investigación, el estudio de los fenómenos plantea inevitablemente 
nuevos problemas, tanto sistemáticos como técnicos. 


Aquellas situaciones en que investigamos dos o más formas de conducta simultáneamente, 
constituyen un área de procesos complejos a la que actualmente se dedica una atención 
experimental considerable. Un ejemplo de ello lo constituye la línea de base de elementos 
múltiples concurrentes que he discutido en el capítulo precedente, donde establecíamos una 
contingencia de reforzamiento separada para cada respuesta, y programábamos estas 
contingencias concurrentemente. Utilizando las líneas de base concurrentes, hay una gran 
probabilidad de que accidentalmente se produzcan contingencias inesperadas y a menudo 
indeseadas. La simple adición de una respuesta a una situación experimental relativamente bien 
estudiada puede introducir un orden de complejidad enteramente nuevo. Tan pronto como 
sometemos más de una respuesta a un control experimental simultáneo, introducimos la 
posibilidad de que se produzcan interacciones incontroladas a través de contingencias de 
reforzamiento accidentales. 


Consideremos en primer lugar uno de los casos más simples. Se posee mucha información acerca 
de los parámetros implicados en el control conductual ejercido por el programa de reforzamiento 
de intervalo variable. Debido a ello, suele considerarse la utilización de este programa como un 
método seguro para generar una conducta de línea de base estable con vistas al estudio de otras 
variables. ¿Qué ocurre cuando aplicamos este conocido programa a dos respuestas concurrentes? 
Las consecuencias de esta operación han sido descritas detalladamente por Skinner, al referirse a 
un experimento en que las palomas utilizadas como sujetos obtenían reforzamientos ocasionales 
picando sobre uno de dos discos colocados a su alcance. El reforzamiento en cada disco se hallaba 
controlado por programas de intervalo variable iguales e independientes; es decir, que un 
reforzamiento obtenido en un disco no alteraba la probabilidad de ser reforzado en el otro. 
Sigue, a continuación, un fragmento textual de los comentarios de Skinner a este experimento: 


Reforzando ocasionalmente una respuesta emitida sobre uno u otro disco sin favorecer a ninguno de los 
dos, obtenemos tasas de respuesta iguales en ambos. La conducta se aproxima a una simple alternación de 
un disco a otro. Este fenómeno sigue la ley de que las tendencias a responder obedecen, a la larga, a las 
probabilidades de reforzamiento. Así, dado un sistema en que uno u otro disco resulte ocasionalmente 
conectado, por medio de un reloj exterior, al mecanismo administrador de comida, de modo que la próxima 
respuesta obtenga reforzamiento, tendremos que si se acaba de responder sobre el disco derecho, por 
ejemplo, la probabilidad de reforzamiento en el disco izquierdo es más alta que en el derecho, puesto que 
ha transcurrido un intervalo de tiempo mayor durante el cual el reloj quizá haya cerrado el círculo 
correspondiente al disco izquierdo. Sin embargo, la conducta de la paloma no se ajusta a esta probabilidad 
por mero respeto a las matemáticas. [El subrayado es mío.] El resultado concreto de una contingencia de 
reforzamiento de este tipo es que el hecho de cambiar al otro disco y picarlo es reforzado con más 
frecuencia que picar sobre el mismo disco dos veces consecutiva (83, página 211). 


Skinner demuestra a continuación que cuando dos respuestas son topográficamente iguales, 
debemos tomar en consideración una conducta adicional: la implicada en la acción de cambiar de 
un disco a otro. A pesar de que solamente reforzamos de un modo deliberado la respuesta de 
picar sobre los discos, en realidad la contingencia genera una cadena de respuestas: picotazo a un 
disco, seguido por el cambio de un disco a otro, seguido a su vez por un picotazo al otro disco. 
Es eslabón intermedio de esta cadena, el paso de un disco a otro, constituye un componente de la 
contingencia de reforzamiento que, aunque poderoso, es accidental y cuya emisión no 
registramos. 


La conducta de cambiar, o de pasar de un disco a otro, es un elemento inherente a cualquier 
situación de respuestas múltiples en que el sujeto no se limite solamente a emitir una de las 
posibles respuestas. Siempre que se emita más de una de las respuestas programadas, es 
necesario que se produzca la conducta de cambiar. Siguiendo el análisis de Skinner, deberíamos 
poder eliminar la conducta de cambiar presentando los dos programas de intervalo variable de un 
modo no independiente. Supongamos que utilizamos una única cinta programadora para ambos 
discos de respuesta. Eb este caso, el cambiar de un disco a otro no tiene más probabilidad de ser 
reforzado que repetir la respuesta sobre un mismo disco. Una situación de este tipo no elimina, 
naturalmente, la posibilidad de cambiar, aunque por desgracia también destruye la línea de base 
concurrente, dado que el sujeto acaba utilizando predominantemente un solo disco. 


Resulta imposible eliminar la conducta de cambiar sin desbaratar la línea de base concurrente. 
La única alternativa, en el caso de que se intente reducir a un mínimo el control ejercido por la 
conducta de cambiar no programada, consiste, en cierto modo, en impedir que dicha conducta 
participe en la contingencia de reforzamiento. Un método para lograrlo es interponer una 
contingencia de dilación, de modo que una respuesta sobre un disco no pueda ser reforzada si se 
ha respondido sobre el otro dentro de los cinco segundos precedentes, por ejemplo. Por lo tanto, 
deberán transcurrir cinco segundos como mínimo entre una respuesta en un disco y un 
reforzamiento en el otro. Este procedimiento en ocasiones surte efecto, pero las condiciones bajo 
las que es eficaz no están totalmente comprendidas. A menudo no cumple con este propósito, 
debido a que la dilación puede convertirse, a su vez, en un componente inherente a la 
contingencia de reforzamiento accidental. 


Existen dos formas principales de ajuste conductual a través de las cuales la dilación puede 
constituirse en un eslabón de la cadena conductual accidentalmente reforzada. Consideremos los 
posibles efectos de una dilación sobre la secuencia “respuesta sobre el disco A, seguida por una 
respuesta de cambiar, seguida a su vez por una respuesta al disco B”. 
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FIGURA 44. Registros acumulativos pertenecientes a dos palomas bajo un programa de 
reforzamiento concurrente de intervalo variable con dos respuestas. Los pájaros no pueden 
obtener reforzamiento con un disco a menos que hayan transcurrido cinco segundos desde una 
respuesta emitida en el otro disco, con lo que as respuestas tienden a emitirse en rachas, con 
pausas que indican el cambio de un disco a otro. (De Findley, 36.) 


Si la respuesta de cambiar sigue inmediatamente a una respuesta sobre el disco A, el requisito de 
dilación comportará un lapso de cinco segundos como mínimo antes de que el disco B pueda 
proporcionar un reforzamiento. El sujeto puede ocupar este período respondiendo 
continuadamente sobre el disco B durante cinco segundos. Luego, si el programa no le otorga un 
reforzamiento, puede volver a cambiar al disco A durante cinco segundos más. Findley pudo 
observar este tipo de ajuste, de modo muy claro, registrando las respuestas emitidas en ambos 
disco y utilizando registradores acumulativos separados, tal como muestra la figura 44. 


Dado que el eje del tiempo en ambos registradores era continuo, el registro obtenido en un disco incluía 
también el tiempo ocupado en responder sobre el otro. La figura 44 muestra los registros escalonados de la 
conducta resultante de dos palomas. En este tipo de registro, los cambios de un disco a otro son fáciles de 
detectar, dado que los sujetos respondían durante un período de tiempo bastante bien definido en cada 
disco, como consecuencia de la contingencia se eliminó, las tasas de las respuestas de cambiar 
aproximadamente se doblaron, y consiguientemente desapareció, en gran medida, el escalonamiento 
característico de cada registro (36, página 124). 


El segundo tipo de ajuste implica un alto en la conducta en vez de una emisión continuada de 
respuestas durante el período de dilación. El sujeto responde sobre el disco A, y luego, en lugar de 
cambiar inmediatamente al disco B, debe demorar cinco segundos la respuesta de cambiar. 
En este caso, no observaremos los períodos alternados de conducta sostenida emitida en cada 
disco. Por el contrario, la pauta consistirá en una única respuesta sobre uno de los discos, seguida 
por un período sin respuesta en ninguno de los dos discos, y luego una respuesta única en el otro. 
La contingencia de dilación se reflejará en un período sin respuesta, en lugar de hacerlo en un 
período de respuesta sostenida. 


También pueden desarrollarse otras pautas, pero esencialmente serán combinaciones de las dos 
que he descrito. Lo que aquí resulta más importante es el hecho de que el tipo de ajuste que se 
producirá no se halla bajo el control del experimentador, sino que depende de las correlaciones 
temporales fortuitas entre la conducta de cambiar y el reforzamiento subsiguiente. 


La conducta de cambiar, o de pasar de un disco a otro, constituye un componente esencial en 
cualquier experimento sobre respuestas múltiples. El hecho de eliminar el reforzamiento de la 
conducta de cambiar será equivalente a reducir nuestra compleja situación a un experimento 
llevado a cabo con una sola respuesta. En lugar de eliminar la conducta de cambiar, nuestra 
solución debe consistir en someter sus fuentes de reforzamiento a control experimental. De este 
modo seremos capaces de tenerla en cuenta en nuestras sistematizaciones, haciéndole jugar un 
papel más o menos importante según nos interese en cualquier experimento concreto. 
Recomiendo al estudiante las investigaciones de Findley sobre la conducta de cambiar, dado que 
se hallan entre los ejemplos más refinados de la investigación que conduce, tanto a nuevas 
técnicas de control, como al descubrimiento de nuevos fenómenos conductuales que poseen su 
propio interés.** 


Hasta aquí he discutido problemas de reforzamiento accidental en situaciones de respuestas 
múltiples en que las respuestas registradas eran topográficamente parecidas. Skinner ha 


demostrado que es suficiente considerar la conducta registrada en estos experimentos como a 
una operante única. La mayor parte de la explicación se apoya en la noción del reforzamiento 
accidental de la conducta de cambiar. Tal como Skinner señaló, la situación es más compleja 
cuando las respuestas registradas difieren en topografía. Cualquier diferencia entre las 
respuestas que nos impida tratarlas como una operante única, nos obligará a considerar otros 
procesos además del reforzamiento accidental de la conducta de cambiar. Las mismas respuestas 
registradas pueden resultar enlazadas en una cadena accidentalmente reforzada. Ya se ha descrito 
un ejemplo de ello en el capítulo 3, páginas 107-110, donde una respuesta obtenía reforzamiento 
con comida y otra cumplía con la función de evitar un time-out. Dado que la respuesta de 
evitación en ocasiones ¡ba seguida por la conducta reforzada con comida, también caía bajo el 
control de este reforzamiento. De este modo, se estableció una cadena accidentalmente 
reforzada, constituida por una respuesta de evitación, seguida por la conducta de cambiar, y 
seguida a su vez por una respuesta reforzada con comida. 


Siempre que una respuesta, en una línea de base de respuestas múltiples, queda implicada en la 
contingencia de reforzamiento que mantiene un componente de respuesta distinto, se pierde 
cierto grado de control experimental. A partir de este momento, los elementos de la línea de base 
no pueden manipularse independientemente uno de otro. Un ejemplo simple de este proceso lo 
constituye un experimento que implica dos respuestas mantenidas concurrentemente, utilizando 
un mono como sujeto. Una respuesta, tirar de una cadena, obtenía comida bajo un programa de 
intervalo variable. Concurrentemente, se programó una contingencia de evitación para la 
respuesta de apretar una palanca. Cada respuesta a la palanca posponía un shock eléctrico 
durante 20 segundos. Sin embargo, debido a una contingencia accidental, ambas respuestas no 
eran independientes entre sí. Los parámetros existentes en esta situación eran de tal tipo que la 
respuesta a la cadena iba seguida la mayoría de las veces por una secuencia repetida de 
respuestas a la palanca. Debido a ello, la respuesta reforzada con comida quedaba 
accidentalmente implicada en la contingencia de evitación. La secuencia formada por un tirón a la 
cadena, seguido por la conducta de cambiar, seguido a su vez por varias respuestas a la palanca, 
quedó establecida como una respuesta de evitación accidentalmente reforzada. ”* 


La figura 45 ilustra de qué modo la contingencia de evitación impidió la manipulación 
experimental independiente de la conducta a la cadena mediante el reforzamiento con comida. 
El primer apartado de la figura 45 muestra la frecuencia de cada respuesta después de retirar el 
shock, o sea, durante la extinción de evitación. Cuando se restableció la contingencia de evitación, 
sin ningún cambio en el programa de reforzamiento con comida, observamos en el segundo 
apartado de la figura 45 un aumento substancial en la tasa de emisión de ambas respuestas. En el 
tercer apartado de la figura, hay una disminución en ambas respuestas cuando se retira la 
contingencia de evitación, a pesar de que el programa de reforzamiento con comida todavía se 
mantenga en vigor. 
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FIGURA 45. Una ilustración de la dependencia mutua entre dos respuestas en un procedimiento 
concurrente de evitación e intervalo variable. (Datos inéditos de Sidman ,74.) 


Vemos, pues, que la contingencia de evitación ha logrado un cierto control sobre la respuesta 
reforzada con comida. Es probable que este control no programado entorpezca la interpretación 
de cualquier operación experimental diseñada para manipular solamente la respuesta de apretar 
la palanca. Cualquier cambio en la conducta de evitación probablemente producirá también, como 
subproducto, un cambio en la conducta reforzada con comida. 


Consideremos las distintas maneras de eliminar estas contingencias accidentales. Un método 
podría consistir en programar un requisito de dilación, de modo que la respuesta de evitación sólo 
resultara eficaz en posponer el shock si hubieran transcurrido cinco segundos, como mínimo, 
desde la última respuesta reforzada con comida. Sin embargo, tal como ocurría en los demás casos 
que he discutido, esta dilación quizás simplemente entrara a formar parte de la contingencia 
accidental, constituyendo un enlazamiento más complejo, aunque igualmente poderoso, entre 
ambas respuestas. Esta dilación podría incluso anular totalmente el propósito de nuestra línea de 
base de respuestas múltiples, impidiendo la emisión de la conducta de cambiar de una respuesta a 
otra. Es especialmente probable que esto suceda si la dilación aumenta la posibilidad de que la 
conducta de cambiar reciba shocks. 


Un segundo método consiste en alterar las contingencias programadas de modo que se reduzcan 
al mínimo las secuencias de respuestas del tipo que conducen al establecimiento de cadenas 
accidentales. Así, por ejemplo, en lugar de un programa de intervalo variable podríamos 
establecer, en el experimento de la figura 45, un programa de razón fija que controlara el 
reforzamiento con comida. Las características del programa de razón son de tal tipo que aumentan 
al máximo la frecuencia de las respuestas reforzadas con comida emitidas sucesivamente, y 
reducen al mínimo la frecuencia con que dichas respuestas reforzadas con comida van seguidas de 


una respuesta de evitación. De este modo, puede controlarse la emisión de la secuencia de 
“respuesta reforzada con comida, seguida por conducta de cambiar, seguida por respuesta de 
evitación”, para que se produzca con tan baja frecuencia que se impida su establecimiento como 
cadena accidental. 


Este procedimiento de impedir las contingencias accidentales por medio de una elección adecuada 
de los programas de reforzamiento, parece tener grandes posibilidades. Sin embargo, en nuestro 
estado actual de conocimiento, no constituye aún la solución final, dado que se sabe poco acerca 
de los factores que determinan la dirección en que se desarrollará una cadena de conducta 
accidental. En el ejemplo precedente vimos la respuesta reforzada con comida encadenada a la 
conducta de evitación. Al cambiar el programa de reforzamiento con comida, de intervalo variable 
a razón fija, se rompió esta cadena accidentalmente, pero existen datos que sugieren que dicha 
cadena simplemente invirtió su dirección, es decir, que la respuesta de evitación cayó bajo el 
influjo del reforzamiento con comida. También hay factores más sutiles que nadie ha empezado 
siquiera a explorar. Probablemente no sea necesario que, para que se desarrolle una cadena 
accidental, una respuesta resulte enlazada de un modo inmediato con un reforzamiento primario. 
Existen algunas contingencias de reforzamiento que generan un poderoso control interno 
mediante la conversión de las propias respuestas en reforzadores condicionados, tal como ocurre 
en la conducta de razón fija y en la porción terminal de un codo de intervalo fijo. De este modo, 
otra conducta que tenga lugar durante una racha de respuestas de razón fija o durante un codo de 
intervalo fijo, puede quedar accidentalmente implicada en las contingencias de reforzamiento, a 
pesar de que las respuestas irrelevantes no se emitan en proximidad temporal del reforzamiento 
terminal. El reforzamiento condicionado que proporcionan las primeras respuestas de una racha 
de razón fija, por ejemplo, puede bastar para incluir otras conductas dentro de una relación de 
encadenamiento accidental. 


Vemos pues, que el reforzamiento accidental en una situación de respuestas múltiples es un factor 
que todavía carece de las técnicas de control adecuadas. A lo más que puedo aspirar en este 
estudio, es a proporcionar al estudiante una apreciación global del problema. La única afirmación 
general de alguna validez que puedo hacer es que las contingencias accidentales son una 
característica inevitable e inherente a las situaciones de respuestas múltiples, y que las técnicas de 
control deben permitirnos evaluar, en vez de eliminar, dichas contingencias. 


XIII. Técnicas de control (continuación) 


En todo experimento se producen muchas conductas que no son registradas y que incluso pasan 
desapercibidas. Debido a que no las hemos seleccionado para su observación, en ocasiones 
cometemos el error de descartar su posible importancia sistemática y técnica, y sin embargo 
pueden jugar un papel mediador decisivo en los procesos que estamos investigando. Ignorar 
deliberadamente estas conductas en nuestros esquemas explicativos constituye un uso erróneo 
del principio operacional. Si las conductas son potencialmente observables, no pueden excluirse 
de nuestras consideraciones en virtud de una decisión arbitraria, en un caso concreto, de 
renunciar a registrarlas. 


La conducta de cambiar, o de pasar de una respuesta a otra, a que me he referido en los apartados 
precedentes, constituye un claro ejemplo de ello. La comprensión y el control de esta conducta, 
casi nunca registrada, así como su participación en las contingencias no programadas, son vitales 
para el estudio de las situaciones complejas de respuestas múltiples. 


LA IMPLICACIÓN DE LA CONDUCTA NO REGISTRADA EN LAS CONTINGENCIAS AMBIENTALES 
CONDUCTA CONTROLADA POR EL MECANISMO ADMINISTRADOR DE COMIDA 


Otro ejemplo de conducta que en general no es registrada y a la que ya he aludido brevemente en 
apartados anteriores, es aquella que es emitida para conseguir el reforzamiento una vez que el 
mecanismo dispensador de comida lo ha colocado a disposición del sujeto. La conducta controlada 
por este mecanismo es especialmente prepotente debido a que es reforzada de inmediato. Se ha 
observado que los animales reforzados con comida suelen pasar una parte considerable de su 
tiempo experimental en actividades tales como lamer, manosear o husmear todas las partes del 
mecanismo administrador de comida que estén a su alcance. Este tipo de conducta puede 
producirse con la suficiente frecuencia para interferirse tanto con la pauta temporal como con la 
tasa de emisión de la conducta registrada. Puede incluso llegar a imponer un verdadero límite 
superior a la tasa de la conducta registrada, disminuyendo por lo tanto la sensibilidad de la línea 
de base en el momento de introducir una operación experimental. Además, debido a que una 
excesiva conducta controlada por el mecanismo administrador de comida no se halla bajo un 
control experimental directo, es probable que el alcance de su influencia varíe acusadamente de 
un experimento a otro, así como de uno a otro experimentador. De hecho, el grado en que la 
emisión de la conducta controlada por el mecanismo administrador de comida es restringida a 
aquellas ocasiones en que resulta apropiada, es decir, la administración de un reforzamiento, 
constituye un criterio que el investigador con experiencia suele utilizar para calibrar el grado de 
competencia técnica que posee un novato es este campo. 


Una excesiva conducta controlada por el mecanismo administrador de comida es generada 
originalmente por un control por estímulos insuficiente. Sin embargo, una vez que se ha generado, 


puede perpetuarse a través de su participación en una contingencia accidental. Consideremos, en 
primer lugar, la forma en que se origina. El experimentador cuidadoso, antes de establecer la 
conducta de línea de base que deberá registrar, somete, primero, sus sujetos a un proceso de 
adaptación al mecanismo administrador de comida, consistente en una administración repetida de 
reforzamientos, sin hacerlo contingentes a ninguna conducta en particular. De hecho, deben 
tomarse precauciones, tal como ahora veremos, para asegurarse de que ninguna respuesta resulte 
sistemáticamente correlacionada con la administración de reforzamientos. 


La adaptación al mecanismo administrador de comida cumple con dos funciones. En primer lugar, 
enseña al sujeto dónde debe encontrar el reforzamiento y cómo ingerirlo. En segundo lugar, 
establece la función discriminativa de los estímulos asociados a la administración del 
reforzamiento.*? Es decir, dichos estímulos asociados deben llegar a indicar aquellas ocasiones en 
que será reforzada la conducta controlada por el mecanismo administrador de comida, dado que 
cuando los estímulos se presentan, la aproximación al comedero va inmediatamente seguida de 
reforzamiento. 


El establecimiento de una función discriminativa en los estímulos asociados con la administración 
de reforzamiento, también cumple con un doble propósito. En primer lugar, asegura el rápido 
condicionamiento subsiguiente de la respuesta que se ha seleccionado para su observación y 
manipulación. Cuando se da al sujeto la ocasión de emitir dicha respuesta, la primera vez que ésta 
se produzca provocará la aparición de los estímulos asociados al mecanismo administrador de 
comida, los cuales, a su vez, inmediatamente harán entrar al sujeto en contacto con el 
reforzamiento. Estos estímulos sirven tanto de reforzador condicionado de la respuesta que los ha 
producido, como de acontecimiento discriminativo que asegura un retraso mínimo en la 
recepción, por parte del sujeto, del reforzamiento primario. Como consecuencia de ello, se 
produce un rápido condicionamiento. 


En segundo lugar, y de más importancia para el asunto que nos ocupa, un buen control 
discriminativo por parte de los estímulos asociados al mecanismo administrador de comida, 
aseguran que la conducta controlada por dicho mecanismo nunca se producirá en ausencia de 
estos estímulos. En los primeros estadios de la adaptación al mecanismo administrador de comida, 
los sujetos emiten un gran número de conductas orientadas al comedero, dado que es éste el tipo 
de conductas más estrechamente relacionado con el reforzamiento. Deben tomarse precauciones, 
por lo tanto, para asegurarse de que esta conducta orientada al comedero no preceda 
sistemáticamente a la administración del reforzamiento. De otro modo, se condicionará 
accidentalmente una conducta inapropiada controlada por el mecanismo administrador de 
comida, que se interferirá con la conducta a investigar experimentalmente. Así, pues, constituyen 
precauciones adecuadas, tanto el someter la conducta controlada por el mecanismo 
administrador de comida a una discriminación con respecto a los estímulos asociados a la 
administración de reforzamiento, como el asegurarse de que no se establezca ninguna correlación 
accidental entre una conducta determinada y la aparición de los estímulos asociados al 
mecanismo administrador de comida. 


Constituye un requisito básico que los estímulos asociados al mecanismo administrador de comida 
posean rasgos característicos y se puedan discriminar fácilmente de otros aspectos del ambiente. 
El investigador con experiencia suele añadir componentes visuales, auditivos o táctiles especiales, 
a los estímulos normales asociados al mecanismo administrador de comida. De este modo, puede 
hacerse centellear una luz o sonar un timbre, por ejemplo, en el momento en que se administra el 
reforzamiento. Dado que éste nunca es administrado a menos que dichos estímulos se hallen 
presentes, este procedimiento incluye automáticamente los ingredientes necesarios para 
establecer una discriminación. La tarea más difícil que queda por realizar consiste en asegurarse 
de que el reforzamiento no se administre de un modo sistemático mientras el sujeto esté 
emitiendo una conducta orientada al comedero fuera de tiempo —o cualquier otra conducta 
igualmente sistemática. Los relés de contacto, las células fotoeléctricas, y otros dispositivos que 
señalen la posición del sujeto pueden ayudarnos a automatizar la tarea. Ciertos aspectos de la 
conducta orientada al comedero, así como de otras conductas distintas, pueden controlarse 
automáticamente con respecto a su correlación con la administración del reforzamiento durante 
la adaptación al mecanismo administrador de comida. Sin estos dispositivos, y quizás incluso con 
ellos, será necesaria una observación directa de los sujetos, así como un control manual de la 
administración de los reforzamiento. Cualquier conducta que, en virtud de las correlaciones 
accidentales con la administración del reforzamiento, adquiera prepotencia, debe ser sometida a 
un proceso de extinción. 


Este procedimiento es laborioso y largo. Hasta hace poco tiempo ha sido posible transigir 
admitiendo el mínimo rigor de control sobre la conducta orientada al comedero necesario para el 
propósito que se perseguía. Sin embargo, a medida que crece el interés en los procesos complejos, 
así como al aumentar la precisión cuantitativa que ha sido posibilitada por otros avances en la 
tecnología conductual, no podemos dejar de lado este problema por más tiempo. Si damos al 
sujeto la ocasión de emitir la respuesta a registrar, antes de que hayamos reducido la conducta 
orientada al comedero a su nivel discriminativo apropiado, es probable que se desarrolle una 
cadena accidental más compleja. En el caso de que se emita frecuentemente en ausencia de los 
estímulos apropiados, la conducta orientada al comedero irá irremisiblemente seguida por el 
reforzamiento de algunas emisiones de la respuesta registrada, debido a lo cual es probable que 
observemos una frecuente y rápida alteración de ambas conductas. La conducta orientada al 
comedero llegará a formar parte, de un modo accidental, de la ocasión discriminativa en que la 
respuesta registrada recibe reforzamiento. En la medida en que esta discriminación no hay sido 
deliberadamente programada por le experimentador, se habrá perdido un cierto grado de control 
experimental sobre la conducta seleccionada para su observación. 


CONDUCTA AVERSIVA 


Los estudios experimentales del castigo y de la conducta de evitación hacen uso deliberado de las 
contingencias accidentales. En la mayor parte de los experimentos sobre evitación, en los que la 
administración de shocks sigue un programa temporal dado, renunciamos al control preciso de la 


relación entre el comienzo del shock y cualquier respuesta concreta —exceptuando, claro está, la 
respuesta de evitación—. Tal como Dinsmoor ha señalado, controlamos y registramos la conducta 
de evitación dentro de unos límites relativamente estrechos, pero permitimos que la clase de 
respuestas castigadas incluya toda la conducta restante del sujeto.? En los experimentos sobre 
castigo, el procedimiento que se sigue es, de modo característico, el opuesto, dado que 
especificamos y registramos la conducta castigada dentro de límites relativamente estrictos, pero 
permitimos que la clase de respuestas de evitación incluya toda la conducta restante del sujeto. 


Estas distinciones conllevan algunas implicaciones teóricas interesantes, aunque no resulta 
apropiado discutirlas aquí. Lo que en este momento me propongo es, simplemente, señalar que el 
abandono del control directo sobre algunas contingencias muy poderosas, en experimentos de 
evitación y castigo, no las excluye de una consideración técnica y sistemática. De hecho, continúan 
influyendo acusadamente en la conducta que realmente observamos, y estas influencias vienen 
determinadas por factores no evaluados. Esta situación es máximamente propicia para que se 
produzcan contingencias accidentales. 


La conducta que más intensamente y con más frecuencia se asocia con el shock en una situación 
de evitación, vendrá determinada, en parte, por la historia que el sujeto aporta al experimento en 
cuestión. También incluirá respuestas que son componentes necesarios de la conducta de 
evitación, pero que no pueden, por sí mismas, posponer el shock. Este tipo de conducta adquiere 
una importancia especial debido al hecho de que aumenta su fuerza a expensas de la eficacia de la 
respuesta de evitación. Para citar un ejemplo, supongamos que hemos elegido la conducta de 
apretar una palanca como respuesta de evitación. El shock resulta pospuesto cuando el sujeto, 
mediante una presión a la palanca cierra un interruptor, y envía un impulso eléctrico momentáneo 
al circuito que retarda la aparición de aquél. De este modo, hemos dispuesto que una única 
fracción muy restringida de los movimientos implicados en apretar la palanca logren evitar el 
shock. Esta fracción de movimiento es la que consigue el cierre inicial del interruptor. 


Sin embargo, se producen otros movimientos, tanto antes como después de cerrarse el 
interruptor, que no logran por sí mismos impedir la administración del shock, pero que son 
concomitantes necesarios de la conducta que consigue cerrar el circuito. El sujeto debe situarse 
frente a la palanca, orientarse en su dirección, tocarla, y empezar a apretarla, todo lo cual ocurre 
antes de que se logre cerrar el interruptor. Una vez que éste ha cerrado el circuito 
momentáneamente, el sujeto debe mantener la palanca apretada, aunque sólo sea por pura 
inercia, durante un período de tiempo finito. Todos estos componentes de la conducta de apretar 
la palanca comparten los efectos reforzadores de la evitación del shock y, sin embargo, es posible 
que sean castigados con frecuencia. Ello se debe a que se puede administrar un shock, por 
ejemplo, precisamente cuando el sujeto toca la palanca al disponerse a apretarla. O bien, el sujeto 
puede apretar la palanca, posponiendo el shock, y luego mantenerla en su posición abatida hasta 
recibir el shock siguiente. En este aspecto, tanto la conducta preparatoria de la respuesta de 
evitación, como la conducta de mantener la palanca abatida, simplemente forman parte de la 
amplia clase de respuestas posibles no especificadas. Sin embargo, se diferencian de los demás 
miembros de esta clase por el hecho de ser reforzadas por la evitación del shock en aquellas 


ocasiones en que la respuesta a la palanca se completa con éxito, debido a lo cual es probable que 
adquieran prepotencia sobre las demás respuestas punibles. Por otra parte, sus fortuitas 
correlaciones accidentales con la administración del shock, reducirán su probabilidad de emisión al 
menos temporalmente. Esta reducción también hará bajar, necesariamente, la frecuencia de la 
conducta de evitación especificada. El resultado neto de estos procesos consistirá en un cierto 
grado de variabilidad incontrolada en la conducta de evitación. 


No hay ningún modo de eliminar la variabilidad derivada de las contingencias accidentales que se 
introducen en nuestras técnicas. La única solución consiste en la aplicación de nuevas técnicas que 
no confíen al azar la formación de las contingencias de evitación y castigo. Quizás sea posible aquí 
utilizar un enfoque racional para desarrollar una técnica de este tipo. Nos interesa, pues, poder 
especificar y controlar, con un grado de precisión aceptable, tanto la conducta castigada como la 
de evitación. Ello significa, antes que nada, que el shock, o cualquier otro estímulo aversivo que 
utilicemos, no puede administrarse según un programa meramente temporal, sino que debemos 
establecer una correlación entre el shock y alguna respuesta específica fácilmente identificable. 
Para establecer una correlación de este tipo, de in modo relativamente estable, serpa necesario 
fortalecer suficientemente la conducta castigada para que se mantenga ante un castigo ocasional. 


Estos requisitos pueden cumplirse, en parte, colocando una respuesta bajo el control de algún 
programa de reforzamiento positivo intermitente, y haciendo que esta misma respuesta obtenga 
un shock según otro programa que, aunque concurrente, actúe de un modo independiente, la 
respuesta a la palanca puede producir también un breve shock bajo un programa de razón fija, de 
modo que, por ejemplo, cada cincuenta respuestas den lugar a la administración de un shock. 


Hasta este momento hemos descrito un método para estudiar el castigo, pero la conducta de 
evitación permanece incontrolada. Los shocks harán disminuir la tasa de respuestas a la palanca 
reforzadas con comida, pero la conducta que reemplazará a estas respuestas queda sin 
especificar, pudiendo ser cualquier otra conducta contenida en el repertorio del sujeto. 


Para lograr que sujeto emita una respuesta de evitación específica sólo necesitamos añadir otra 
condición que rija la administración del shock: la respuesta de apretar la palanca sólo puede 
producir un shock si alguna otra respuesta especificada deja de emitirse. Escojamos, pues, como 
respuesta de evitación, la respuesta de empujar un panel colocado en el recinto experimental. 
Cada vez que el animal empuja el panel, el mecanismo que cuenta las respuestas del programa de 
razón vuelve a marcar cero, y empieza la cuenta de nuevo. Si el sujeto se comportara con la 
máxima eficacia, podría emitir 49 respuestas a la palanca, algunas de las cuales le proporcionarían 
comida, y luego emitir una respuesta al panel, ya que esta última restituiría a cero el contador del 
programa de razón, impidiendo así que la próxima respuesta a la palanca produjera un shock. 


Una técnica de este tipo nos permitiría especificar tanto la conducta castigada (apretar la palanca), 
como la conducta de evitación (empujar el panel). Ninguna de las dos contingencias se abandona 
al azar o a variables incontroladas. 


Además, ningún componente de la respuesta de evitación puede recibir un shock, dado que es 
necesario emitir una respuesta a la palanca para que el shock se produzca. Los shocks nunca 
pueden producirse mientras el animal se está acercando al panel o husmeándolo, o cuando se 
halla en los primeros estadios de la respuesta de empujarlo. No puede haber, pues, correlación 
accidental alguna entre ningún aspecto de la respuesta de evitación registrada y la administración 
del shock. 


Una técnica de este tipo nos permitiría examinar los efectos del castigo sobre la respuesta de 
apretar la palanca, así como los efectos de la contingencia de evitación en la respuesta de empujar 
el panel, o ambos fenómenos junto con sus interacciones. Sin embargo, no se producirá ninguna 
inestabilidad a causa de correlaciones accidentales entre la conducta no registrada y los shocks. Se 
pueden hacer infinitas variaciones sobre el tema, que brindo al estudiante interesado en 
desarrollarlas. 


REFORZAMIENTO RETARDADO 


Siempre que tiene lugar un retraso entre la conducta registrada y la consecuencia que se ha 
programado, podemos estar seguros de que este período de dilación no permanece vacío. 
Siempre se está emitiendo alguna conducta, y a pesar de que no la registremos, puede que juegue 
un papel decisivo al influir en los efectos del retraso. 


Un clásico ejemplo de ello es el reforzamiento retardado. Se han llevado a cabo muchos 
experimentos para investigar los efectos de intercalar un período de tiempo entre la emisión de 
una respuesta y la administración de su reforzamiento primario. La conclusión que se suele sacar 
de estos experimentos es que la eficacia del reforzador disminuye al aumentar la duración del 
retraso, observándose que un reforzamiento posee una eficacia máxima para condicionar y 
mantener una respuesta dada si es inmediato. 


En vista de las inevitables contingencias accidentales que se producen en un estudio del 
reforzamiento retardado, no es de sorprender que se llegue a esta conclusión. Si el reforzamiento 
no sigue inmediatamente a la respuesta que se requirió para su administración, seguirá a alguna 
otra conducta. Su principal efecto lo ejercerá sobre la conducta que, de un modo indudablemente 
accidental, le anteceda más inmediatamente. Así, puede decirse que el efecto de un retraso 
consiste en dispensar el reforzamiento entre un gran número de respuestas no registradas, en 
lugar de concentrarlo sobre la conducta que se registra. 


Debido a la intromisión de las contingencias accidentales, el reforzamiento retardado resulta 
menos eficaz que el inmediato. Sin embargo, es posible invertir los efectos de esta intromisión 
mediante una manipulación experimental adecuada, de modo que podamos utilizar las 
contingencias accidentales para mantener la conducta cuyo reforzamiento primario se retrase 
apreciablemente. Un método para conseguirlo consiste en empezar con un retraso breve, e ir 
aumentándolo gradualmente. Este procedimiento, mediante el cual se consiguió un retraso de 60 


segundos, fue utilizado con éxito por Ferster empleando palomas como sujetos experimentales. Lo 
que sigue es un fragmento de su análisis: 


Debido a la extinción que tiene lugar durante el retraso de 60 segundos, la administración de la comida va 
precedida de una gran variedad de conductas, y no es probable que ninguna respuesta sea reforzada con la 
frecuencia suficiente para adquirir una fuerza apreciable. Sin embargo, si los retrasos son del orden de uno a 
cinco segundos, la probabilidad de que una misma respuesta se emita inmediatamente antes de la 
administración de la comida, es mucho mayor, con lo cual los miembros de una clase de respuestas única 
serás reforzados con la suficiente frecuencia para quedar condicionados. Cuando el período de retraso se 
alarga después de cierto número de reforzamientos de la misma respuesta, el retraso define un programa 
de reforzamiento de intervalo fijo de la respuesta “supersticiosa”. Este programa es sólo distinto de aquellos 
que comúnmente se emplean por el hecho de que se administrará el reforzamiento tanto si se ha emitido la 
respuesta como si no. Para mantener la conducta “supersticiosa”..., es necesario ajustar el intervalo de 
retraso de modo que el reforzamiento se administre solamente cuando la respuesta “supersticiosa” se emita 
con la máxima frecuencia (30, página 223). 


El uso de este procedimiento por parte de Ferster muestra de qué modo se puede sacar provecho 
de las contingencias accidentales al estudiar la conducta cuyo reforzamiento se retrasa 
considerablemente. La técnica de aumentar gradualmente la duración del retraso tiene, sin 
embargo, un grave inconveniente desde el punto de vista del control experimental. La respuesta 
que queda implicada en la contingencia accidental no puede especificarse de antemano, y es 
probable que varíe de uno a otro sujeto. El efecto de una operación experimental puede muy bien 
ser una función de la conducta particular que ha quedado implicada en la contingencia accidental. 
Debido a ello, quizá los datos que obtengamos muestren una variabilidad intrasujeto excesiva. 


Ferster también nos ha mostrado el modo de superar esta dificultad. Su técnica implica, en primer 
lugar, el condicionamiento deliberado. Mediante el reforzamiento inmediato, de la respuesta que 
eventualmente incluirá en la contingencia de reforzamiento la conducta interpuesta entre la 
respuesta registrada y el reforzamiento.” Ferster también coloca esta conducta bajo un control por 
estímulos. A continuación, hace depender la aparición del estímulo que controla dicha conducta, 
de la emisión de otra respuesta. En el estadio siguiente, el reforzamiento de la conducta 
interpuesta se programa mediante un reloj únicamente, de modo que, de hecho, el reforzamiento 
resulta independientemente de la emisión de cualquier conducta específica, excepto de la 
respuesta remota que hizo aparecer el estímulo y puso en marcha el reloj. Sin embargo, puesto 
que ya se ha condicionado con apreciable intensidad una respuesta específica, ésta “cae” bajo el 
reforzamiento y es mantenida por la contingencia que ahora pasa a ser accidental. 


El programa de reforzamiento empleado en el estadio inicial de este procedimiento es decisivo, y 
su elección requiere la aplicación de una tecnología conductual que se ha desarrollado en otros 


* En un procedimiento de reforzamiento retardado, la expresión “mediating behavior” denota la conducta 
que tiene lugar entre la emisión de la respuesta registrada y la administración del reforzamiento. De ahora 
en adelante, nos referiremos a esta conducta con la expresión “conducta interpuesta”, simplemente. (N. del 
1.) 


contextos. De nuevo citaré directamente a Ferster, el cual utilizó un programa de intervalo fijo 
para el condicionamiento original de la conducta interpuesta. 


Las propiedades de un programa de intervalo fijo tendrán una importancia crucial en el hecho de que la tasa 
de emisión de la respuesta “supersticiosa” sea alta en el momento de la administración del reforzamiento. 
Un programa de intervalo fijo produce efectos distintos después de una larga aceptación al mismo, o sea, 
cuando se alcanza una conducta estable. En los estadios iniciales de un reforzamiento de intervalo fijo, la 
frecuencia de la conducta es alta al principio del intervalo, y disminuye gradualmente hasta la 
administración del próximo reforzamiento. Estas condiciones son adversas para el mantenimiento de la 
conducta “supersticiosa”, a menos que el retraso se ajuste de tal modo que la administración del 
reforzamiento tenga lugar en un momento en que la tasa de respuestas debidas al reforzamiento previo sea 
todavía alta. Sin embargo, después de una suficiente adaptación al programa, se invierte la disposición de la 
tasa. Ésta es baja al principio del intervalo, y aumenta gradualmente hasta que se alcanza una tasa estable, 
lo cual constituye una característica del intervalo fijo. Bajo estas condiciones, el intervalo de retraso puede 
alargarse con mayor rapidez, sin que se den muchos casos en que la administración del reforzamiento vaya 
precedida por una respuesta distinta de la condicionada previamente (30, páginas 223-224). 


Confiriendo a una respuesta dada una historia de reforzamiento apropiada, casi podemos 
garantizar que esta respuesta será la que resultará accidentalmente reforzada por un 
reforzamiento retardado, dado que una pauta conductual sólida, junto con sus estímulos 
ambientales asociados, implicará un reforzador condicionado inmediato lo suficientemente 
poderoso para mantener la conducta cuyo reforzamiento primario resulta retardado. Esta técnica 
tiene la ventaja de permitirnos especificar, controlar y registrar la conducta interpuesta mantenida 
accidentalmente, así como conservarla constante de uno a otro sujeto. 


Queda por considerar, sin embargo, una complicación que puede dar lugar a ambigiedades 
considerables en la evaluación de los datos obtenidos en los estudios del reforzamiento retardado. 
Esta complicación es inherente a cualquier experimento en que tengan lugar contingencias 
accidentales, y se deriva del hecho de que, al margen de cómo se generen inicialmente estas 
contingencias, continúan bajo la influencia de variables que no se hallan bajo un control 
experimental directo. En el experimento que he descrito más arriba, por ejemplo, Ferster nos 
muestra cómo limitar la acción de una contingencia accidental a una conducta especificada de 
antemano. Esta técnica constituye un avance importante en el estudio de la conducta cuyo 
reforzamiento resulta considerablemente retardado. Sin embargo, incluso una contingencia 
accidental a la que inicialmente conferimos una forma deseada a través de una aplicación 
deliberada de la tecnología conductual, adquiere, a la larga, vida propia. La conducta interpuesta 
no es de hecho necesaria para que se produzcan las contingencias que la mantienen. Si alguna 
operación experimental, o incluso alguna variable incontrolada, interrumpe temporalmente la 
correlación entre la conducta y sus consecuencias accidentales, esta conducta puede desaparecer, 
pero nunca reinstaurarse. En lugar de ello, será reemplazada, debido a lo cual se plantearán de 
nuevo los problemas de variabilidad y de control inadecuado de las variables relevantes. 


La solución a este problema, dentro de los estudios del reforzamiento retardado, viene dada, de 
hecho, por el paso intermedio de la técnica de Ferster para establecer una conducta interpuesta 


accidentalmente reforzada. Este paso intermedio consistía en una cadena del tipo que he descrito 
anteriormente al hablar de los experimentos de discriminación (páginas 335-336). Siguiendo este 
procedimiento, el experimentador hace que una respuesta provoque la aparición de un estímulo 
discriminativo en lugar de un reforzamiento terminal. En presencia de este estímulo, la misma 
respuesta, o incluso otra distinta, obtiene un reforzamiento primario o terminal. Ambos 
componentes de esta cadena, aquel cuya consecuencia es un reforzador condicionado y el que se 
halla asociado a un reforzamiento primario, pueden controlarse por programas distintos e 
independientes entre sí. Colocando el segundo componente bajo un programa de intervalo es 
posible controlar con precisión el período de retraso en la administración del reforzamiento 
terminal. Naturalmente, se mide el retraso a partir del elemento inicial de la cadena. Colocando el 
primer componente bajo un programa intermitente de reforzamiento condicionado, aumenta la 
sensibilidad de la línea de base, lo cual permite observar un amplio intervalo de variación 
controlada en función de distintos retrasos. 


El encadenamiento y el reforzamiento retardado no se han considerado, tradicionalmente, como 
procesos de la misma especie. Sin embargo, el reforzamiento retardado da lugar, de hecho, a una 
cadena cuyo componente final no suele especificarse o controlarse de un modo directo. 
La respuesta cuyo reforzamiento resulta retardado, siempre va seguida por una conducta sin 
analizar que puede actuar como estímulo que salve el retraso. Una técnica de encadenamiento 
deliberada simplemente explicita la secuencia, y la hace susceptible de examen y manipulación. 
El reforzamiento retardado siempre implica alguna conducta terminal inmediatamente anterior a 
la administración del reforzamiento primario. Las propiedades de esta conducta constituyen un 
factor crítico para extender los efectos del reforzamiento retardado a la respuesta registrada. 
¿Por qué no hacer que esta conducta interpuesta sea a la vez explícita y permanente? La pérdida 
de control conductual en el experimento de Ferster,* después del cambio de una contingencia 
real a una accidental, demuestra la debilidad intrínseca de la segunda para mantener la conducta a 
largo plazo. 


RESPUESTA RETARDADA 


Existen varios tipos de experimentos sobre respuesta retardada, constituyendo todos ellos campo 
abonado ideal para la producción de contingencias accidentales. En el procedimiento clásico, se 
presenta al sujeto un determinado estímulo, pero se le impide que emita inmediatamente la 
respuesta apropiada a este estímulo. Después de haber transcurrido un cierto tiempo, se retira la 
limitación, y se da al sujeto la oportunidad de emitir o bien una respuesta adecuada, o bien 
cualquier otra de entre varias respuestas posibles. Así, por ejemplo, se puede dejar que un mono 
vea cómo un grano de uva es colocado dentro de un recipiente situado entre varios recipientes 
similares. A continuación, se interpone una barrera para evitar que le mono lo coja. Después de un 
intervalo de espera, el experimentador retira la barrera y observa si el sujeto escoge el recipiente 
correcto. Este procedimiento se ha considerado como un test de memoria, o incluso de un 
“proceso mental superior”. 


Sin embargo, algunos investigadores cuyo interés se ha centrado en los procesos conductuales 
más que en las elucubraciones de hipótesis, han observado ciertas regularidades en la conducta de 
sus sujetos durante el intervalo de retraso. Estas regularidades se han descrito en ocasiones como 
respuestas de orientación. El sujeto suele adoptar una postura en que todo su cuerpo, o parte de 
él, se mantiene en una posición constante con respecto al recipiente correcto. Esta conducta 
interpuesta puede permitir al sujeto escoger el recipiente correcto incluso después que haya 
transcurrido un intervalo de tiempo considerable. Los efectos de otras variables, tales como 
lesiones del sistema nervioso central, o agentes farmacológicos, es probable que dependan no 
sólo de la presencia o ausencia de dicha conducta interpuesta, sino también de sus características 
cualitativas y cuantitativas. 


En relación con lo que estamos discutiendo, podemos simplemente señalar que la conducta 
interpuesta en experimentos sobre respuesta retardada, se halla bajo el control de una 
contingencia accidental. El experimentador no exige una conducta de orientación específica, antes 
de poner la uva al alcance del mono. Sin embargo, dado que la respuesta reforzada debe ir 
precedida por algún otro tipo de conducta durante el intervalo de espera, es, de hecho, toda la 
secuencia la que resulta fortalecida por el reforzamiento. 


Este tipo de contingencia accidental presenta una característica algo distinta de las otras a que ya 
me he referido anteriormente. A pesar de que el experimentador no incluye la conducta 
interpuesta entre las contingencias programadas, esta conducta permite una adaptación 
conductual más eficaz. Las respuestas precedidas por una conducta de orientación apropiada 
resultarán reforzadas con mayor frecuencia que aquellas que sigan, o bien a orientaciones 
inadecuadas, o bien a alguna forma inconsistente de conducta. 


La situación de respuesta retardada contiene, pues, ciertas restricciones inherentes sobre el tipo 
de conducta que puede quedar implicada en la contingencia accidental. Tenemos aquí, por lo 
tanto, un caso de reforzamiento accidental diferencial, lo cual, en cierto sentido, facilita nuestra 
labor de control. Si continuamos el experimento durante un tiempo suficientemente largo, es 
probable que el procedimiento seleccione, por sí solo, la forma más eficaz de conducta 
interpuesta, debido a lo cual la variabilidad intrasujeto se reducirá al mínimo. De la misma forma, 
el problema de la irreversibilidad no será tan grave como en otros tipos de contingencias 
accidentales, puesto que en el caso de que una operación experimental dada alterara 
temporalmente la conducta interpuesta, el reforzamiento diferencial la restituirá a su forma más 
eficaz. 


A pesar de que disminuye la gravedad de los problemas planteados por la variabilidad e 
irreversibilidad, éstos no desaparecen, ni mucho menos, de los experimentos sobre respuesta 
retardada. En primer lugar, puede que deba transcurrir mucho tiempo antes de que la conducta 
interpuesta consiga adoptar su forma más eficaz. Hasta que un experimentador no haya adquirido 
una larga experiencia, no dispondrá de los medios para juzgar si un experimento dado ha 
alcanzado dicho estadio. En segundo lugar, en la medida en que pueda haber más de una forma de 
conducta interpuesta óptima, o casi óptima, persistirán los problemas planteados por la 


variabilidad e irreversibilidad. De todos modos, el modelamiento automático de la conducta 
interpuesta puede, en otro sentido, hacer todavía más apremiante nuestro problema de control. 
El hecho de que una forma particular de conducta interpuesta reciba un reforzamiento diferencial, 
indica que las contingencias accidentales no son tan sólo inconvenientes secundarios de los 
experimentos sobre respuesta retardada, sino que, por el contrario, constituyen aspectos 
esenciales de los procesos conductuales que examinamos. Dicha conducta interpuesta requiere, 
por lo tanto, el máximo grado de control experimental, así como la mayor precisión de registro, de 
que seamos capaces. 


El primer requisito lo constituye la automatización. Sin ella, el trabajo que acarrearía extender el 
experimento sobre respuesta retardada durante un período de tiempo lo suficientemente largo 
para estabilizar la conducta interpuesta, resultaría prohibitivo. Del mismo modo, sin autorización, 
no sería factible un registro preciso y continuado de la conducta interpuesta. El control automático 
nos permitirá ir aún más lejos, dado que con él podemos seleccionar, para su reforzamiento 
diferencial, cualquier forma de conducta interpuesta que deseemos, eliminando, de esta manera, 
totalmente los problemas planteados por la irreversibilidad y variabilidad entre sujetos, y 
reduciendo, a la vez, el tiempo requerido para alcanzar la estabilidad. Utilizando un tipo de 
conducta interpuesta cuyas características sean conocidas, también podremos aplicar un criterio 
de estabilidad válido. 


Resulta relativamente simple programar formas arbitrarias de conducta interpuesta. Para ello, 
debemos disponer un ambiente en que sean posibles varias respuestas registrables, algunas de las 
cuales deberán emplearse como conducta interpuesta durante el intervalo de retraso, y deberá 
permitirse al sujeto emitir las demás al final del mismo. Programaremos el equipo de control de 
modo que ponga en correlación cada respuesta interpuesta con una correspondiente respuesta de 
elección. Luego, dependiendo del estímulo inicial previo al retraso, que especificará cuál de las 
respuestas a elegir es la correcta, requeriremos al sujeto que emita solamente la conducta 
interpuesta apropiada durante el retraso. Si se emite una conducta interpuesta distinta, la 
respuesta elegible quedará sin reforzar, aun en el caso de que sea la apropiada. 


Citemos ahora un ejemplo concreto. Si tuviéramos que usar una paloma como sujeto, la situación 
experimental podría ser similar a la que se describe en el capítulo 7, figura 22. Esta situación sólo 
debe modificarse añadiendo pulsadores adicionales a ambos lados de la barra central. Con ello, la 
paloma se enfrentaría a una disposición de cinco componentes: la barra central dos pulsadores 
dispuestos horizontalmente a la izquierda de la barra, y dos pulsadores más dispuestos de una 
forma similar a la derecha. Denominaremos pulsadores interiores, a los dos pulsadores 
inmediatamente adyacentes a la barra, distinguiéndolos en derecho e izquierdo respectivamente, 
y los dos pulsadores situados en los extremos se denominarán pulsadores externos, 
distinguiéndolos también en derecho e izquierdo. La barra central proporcionará el estímulo que 
inicie el período de retraso, la respuesta de picar sobre los pulsadores interiores constituirá la 
conducta interpuesta, mientras que la conducta de picar sobre los pulsadores exteriores 
constituirá la respuesta de elección. 


Empieza un ensayo cuando la barra central se halla iluminada o bien por una luz roja, o bien verde. 
(Al cabo de cierto tiempo, “se pedirá” a la paloma que pique al pulsador exterior que se halle 
iluminado del mismo color.) Para asegurarse de que la paloma observa la barra central, ésta 
permanece iluminada hasta que aquélla la pica. Con el primer picotazo la luz de la barra central se 
apaga, y comienza el período de retraso. 


Al final del período de retraso, ambos pulsadores exteriores se iluminarán, uno rojo y el otro 
verde. Un picotazo sobre el pulsador cuya luz sea la misma que la que antes iluminaba la barra 
central, reportará comida a la paloma hambrienta, sí su conducta durante el período de retraso ha 
sido la adecuada, la cual describiré a continuación. 


Si la respuesta retardada elegible debe ser reforzada, no sólo es necesario que sea la respuesta 
adecuada, sino que la paloma deberá haber picado uno, y sólo uno, de los pulsadores interiores 
durante el período de retraso. Si la barra estaba roja, el sujeto deberá picar sólo sobre el pulsador 
interior izquierdo durante el período de retraso; si la barra estaba verde, sólo deberá ser picado el 
pulsador interior derecho en el período de retraso. Si la paloma no pica ninguno de los dos 
pulsadores interiores, o bien si ha picado sobre ambos, la respuesta elegible no obtendrá 
reforzamiento alguno. 


De este modo se obliga a la conducta interpuesta a formar parte de la contingencia de 
reforzamiento. Sin la conducta interpuesta apropiada durante el período de retraso, ni siquiera la 
respuesta de elección correcta obtendrá reforzamiento. La conducta interpuesta es especificable y 
registrable, dos propiedades que probablemente hubieran sido imposibles de conferir si 
hubiésemos partido solamente de las contingencias accidentales. Con un período de retraso 
constante, la conducta interpuesta probablemente presentará características de intervalo fijo, y 
las mediciones usuales de la conducta de intervalo fijo nos proporcionarán una información 
cuantitativa detallada sobre el estado en que se halla la conducta interpuesta en cualquier fase del 
experimento. 


Podríamos simplificar el experimento, desde un punto de vista técnico, eliminando dos de los 
pulsadores y utilizando la misma respuesta tanto como conducta interpuesta como conducta 
elegible. Una modificación de este tipo pone de manifiesto la acusada similitud entre un 
experimento sobre respuesta retardada y la línea de base de elementos múltiples encadenados 
sometida a un control por estímulos (ver páginas 335-336). La diferencia principal entre las dos 
situaciones reside en las duraciones relativas de los estímulos que controlan cada elemento de la 
cadena suelen estar presentes ininterrumpidamente. Cuando los estímulos que controlan los 
elementos de una línea de base múltiple son breves, la conducta debe cumplir, por sí misma, con 
la función discriminativa. Esta es la esencia del papel mediador que adquiere la conducta 
accidentalmente reforzada en los experimentos sobre respuesta retardada. 


La técnica de respuestas retardada clásica, de la cual nuestro ejemplo es una modificación, 
interpone un retraso entre la presentación de los estímulos exteroceptivos y la oportunidad para 
que el sujeto responda adecuadamente. La duración del retraso entre estímulo y respuesta es 
independiente de la conducta del sujeto. Al término del retraso, el experimentador presenta de 


nuevo los estímulos y registra aquel estímulo al que se dirige la respuesta del sujeto. Cuando la 
respuesta es apropiada a la contingencia de reforzamiento, se considera que el sujeto ha superado 
con éxito el período de retraso. Variando la longitud del retraso, y registrando las elecciones de 
estímulo correctas e incorrectas, podemos obtener una relación funcional que describa la eficacia 
del sujeto en superar distintos intervalos de tiempo. 


Podemos conseguir una información similar utilizando otras técnicas. El elemento de retraso que 
es común a todas ellas requiere una atención continuada sobre las contingencias accidentales. 
Así, por ejemplo, podemos presentar al sujeto un estímulo único y exigirle que posponga su 
respuesta durante un período de tiempo determinado después de la presentación de dicho 
estímulo. Si la respuesta se emite demasiado pronto, simplemente no obtiene reforzamiento. 
Con este procedimiento, restringimos el estímulo exteroceptivo a un solo componente. El tiempo 
entre el estímulo y la respuesta, sin embargo, se halla bajo el control del sujeto, y nuestro registro 
consistirá en una tabulación de estos intervalos. De nuevo podemos obtener relaciones 
funcionales que describan la eficacia del sujeto en superar períodos de tiempo de distintas 
duraciones. El procedimiento de espaciamiento de respuestas (ver página 382) constituye 
esencialmente una variación de esta técnica en la que el estímulo que inicia el período de retraso 
se origina en la propia conducta del sujeto en lugar de hacerlo en el ambiente. 


Tal como ocurría con la técnica de respuesta retardada clásica, los datos obtenidos por medio de 
la técnica de espaciamiento de respuestas o por cualquiera de sus variantes, requieren la 
evaluación de la conducta interpuesta que se emite durante el período de retraso. Una respuesta 
reforzada que siga a un período de retraso superado con éxito, debe ir precedida de alguna otra 
conducta, y es de esperar que el efecto reforzante se extienda hasta alcanzar esta conducta 
anterior. Debido a este tipo de reforzamiento accidental, puede desarrollarse una cadena de 
conducta. Muchos investigadores han confirmado, de hecho, la observación de Wilson y Keller de 
que puede desarrollarse una secuencia estereotipada de conducta durante el período de retraso.” 
al igual que en el experimento sobre respuesta retardada clásica, esta conducta estereotipada 
puede cumplir con la útil función, ayudando al sujeto a superar el intervalo de retraso. Cualquier 
cadena accidental que se desarrolle resultará diferencialmente reforzada con respecto a la 
velocidad con que se ejecuta. Así, si la cadena es demasiado breve, la respuesta registrada 
subsiguiente no será reforzada. La secuencia es análoga a un sistema de cuenta, con una respuesta 


terminal que se emite al alcanzarse un número determinado. 


Las condiciones bajo las que la conducta interpuesta evolucionará hacia una situación de 
espaciamiento de respuestas, todavía no se comprenden con claridad, dado que no siempre se 
produce este fenómeno. Ello hace que nuestro problema de control sea aún más apremiante. 
Además, al revés de lo que sucede con el procedimiento tradicional de respuesta retardada, en el 
que la conducta interpuesta queda automáticamente restringida a algún tipo de conducta de 
orientación, la técnica de espaciamiento de respuestas no restringe en modo alguno la forma que 
adoptan las respuestas interpuestas. De nuevo, pues, nos enfrentamos al doble fantasma de la 
variabilidad entre sujetos y de la reversibilidad. Una variabilidad de este tipo puede, por ejemplo, 
ayudarnos a explicar por qué la capacidad de las ratas blancas de espaciar sus respuestas 


eficazmente parece perderse sólo temporalmente cuando ciertas áreas corticales del cerebro les 
son extirpadas. Quizás esta operación sólo sirva para destruir la conducta interpuesta concreta 
que el sujeto estaba usando, produciéndose la recuperación al reforzarse accidentalmente una 
nueva secuencia. 


No es necesario que esta especulación que he llevado a cabo sea acertada para convencernos de 
que la conducta interpuesta condicionada accidentalmente puede jugar un papel decisivo en los 
procesos conductuales generados por una técnica de espaciamiento de respuestas. Hasta que no 
se clarifique este papel, no podemos estar seguros de cuáles son los métodos de control más 
eficaces. Una posibilidad sería la de disponer una situación en que el procedimiento experimental 
restringiera la forma adoptada por la conducta interpuesta. En este sentido nos pueden ayudar las 
investigaciones llevadas a cabo por Mechner”* cuya técnica implica una situación de doble 
respuesta. El reforzamiento de una respuesta depende del número de veces que con anterioridad 
se haya emitido la otra. Así, por ejemplo, le sujeto debe apretar diez veces consecutivas la palanca 
A antes de que una respuesta a la palanca B pueda conseguirle un reforzamiento. De este modo, la 
conducta interpuesta se especifica de un modo singular, y puede medirse independientemente. 
Ante nuestra ignorancia acerca del papel que juega la conducta interpuesta en los experimentos 
sobre espaciamiento de respuestas, la relevancia de la técnica de Mechner puede ser discutible. 
Sin embargo, en la medida en que las respuestas espaciadas están controladas por cadenas 
accidentales no registradas, la situación de “cuenta” de doble respuesta, simplemente hace 
explícito este control. 


DISTINTOS TIPOS DE CONTINGENCIAS ACCIDENTALES 


Una operación experimental aplicada a una línea de base conductual en curso, puede reducir, al 
menos temporalmente, la frecuencia del reforzamiento. Mientras que la conducta quizás, a la 
larga, se ajuste a las nuevas condiciones y recobre la frecuencia de reforzamiento original, la 
disminución temporal inicial puede autoperpetuarse. Ello es particularmente probable si el 
comienzo del cambio está marcado por un estímulo de aparición periódica, tal como se presenta al 
principio de la sesión experimental. 


Supongamos, por ejemplo, que la conducta de línea de base es mantenida por un programa de 
reforzamiento de intervalo variable. Tal como se aplica normalmente este programa, cada vez que 
la cinta programadora pone un reforzamiento a disposición del sujeto, el reforzamiento se 
mantiene en esta situación hasta que se emite la respuesta siguiente. Una operación experimental 
podría consistir en limitar el período de disponibilidad del reforzamiento. Si una respuesta no se 
emite, por ejemplo, dentro del medio segundo, medido desde el momento en que el 
reforzamiento ha sido colocado a disposición del sujeto, éste pierde la oportunidad de obtenerlo. 
Supongamos que hemos introducido esta contingencia de “disponibilidad limitada” al comienzo de 
un período experimental. Es probable que su efecto inicial se caracterice por una acusada 
reducción en la frecuencia de reforzamiento. En un estadio posterior de la sesión experimental, la 
conducta puede ajustarse apropiadamente a la situación aumentando la tasa, a medida que la 


nueva contingencia se afianza. Sin embargo, los estímulos coincidentes con el comienzo de la 
sesión han llegado a correlacionarse con una frecuencia de reforzamiento baja, lo cual genera, a su 
vez, una tasa también baja, de modo que es posible que el comienzo de cada sesión subsiguiente 
se caracterice por una reducida tasa de respuesta. 


Este proceso se autoperpetúa. La reducida tasa que se observa al principio de la sesión mantiene 
la frecuencia de reforzamiento a un nivel correspondientemente bajo, y este proceso circular 
asegura una correlación continuada entre el comienzo de una sesión y un reforzamiento poco 
frecuente. Sin embargo, mientras que este efecto de precalentamiento puede ser consistente en 
un sujeto dado, quizás no se observe en otros. El hecho de que aparezca este efecto dependerá de 
la tasa de respuestas de línea de base original, de la duración del período de disponibilidad 
limitada, y probablemente también de alguna función combinada de estas variables. 
Otros factores relevantes incluirán el grado de estabilidad normalmente observado en la línea de 
base original. El estado de deprivación del sujeto, la peculiaridad del estímulo correlacionado con 
el comienzo de las sesiones experimentales, así como la historia conductual del sujeto. Cualquier 
variable que permita una exposición, aunque sólo sea breve, del sujeto a la contingencia real al 
principio de la sesión, puede desbaratar la correlación accidental. 


Por lo que se refiere a las contingencias accidentales, la falta de control directo aumenta los 
efectos de variables que quizás fueran casi completamente ineficaces ante una contingencia 
deliberadamente programada. Por otra parte, además de los peligros de la variabilidad, debemos 
enfrentarnos con la ambiguedad de nuestra comprensión del proceso conductual observado, 
puesto que si no admitimos la posibilidad de una extinción accidental, quizá dediquemos un 
esfuerzo experimental y especulativo considerable a la búsqueda de otros procesos que expliquen 
le fenómeno del precalentamiento. 


La posibilidad de una extinción accidental no tiene por qué limitarse al comienzo de una sesión 
experimental. Se trata de un problema más general, acerca de las relaciones fortuitas entre 
frecuencia de reforzamiento y estímulos concretos. La relación puede ser puramente accidental, y 
puede generar una probabilidad de respuestas mayor o menor, requiriéndose solamente para ello 
cierta irregularidad en la conducta de línea de base Morse y Skinner han llevado a cabo una 
singular y definitiva demostración.* Utilizando palomas como sujetos, la conducta de línea de 
base consistía en una tasa de respuestas baja de promedio, mantenida por un programa de 
reforzamiento de intervalo variable. El disco de respuesta se hallaba normalmente iluminado por 
una luz de color naranja, pero una vez cada hora se proyectaba una luz azul durante cuatro 
minutos sobre el disco. El programa de presentación del estímulo azul era independiente del 
programa de reforzamiento. 


A pesar de que la luz no se programó formando parte de ninguna contingencia de reforzamiento, 
la tasa de respuesta cayó bajo el control de este estímulo. En algunos casos, la tasa de respuesta 
disminuía hasta alcanzar un valor muy bajo en presencia del estímulo azul, y, en otros, la tasa 
resultaba consistentemente mayor que la línea de base. El relato de Morse y Skinner nos 
proporciona un análisis conciso de los hallazgos. 


Un estímulo que se halle presente cuando una respuesta es reforzada, puede adquirir un control 
discriminativo sobre ella, a pesar de que su presencia en el momento del reforzamiento sea accidental. 
Supongamos, por ejemplo, que un organismo se halla respondiendo a una tasa moderada bajo un programa 
de reforzamiento de intervalo variable, y dejamos que un estímulo incidental (A) aparezca ocasionalmente 
durante un breve período de tiempo cada vez. A pesar de que no haya una relación temporal explícita entre 
la aparición de A y el programa de reforzamiento, en ocasiones se reforzará una respuesta en presencia de 
A. durante un breve período, la frecuencia de este reforzamiento puede ser apreciablemente mayor que en 
ausencia de A. un organismo que sea sensible a diferencias ligeras en la tasa de reforzamiento desarrollará 
una discriminación, de modo que su tasa de respuestas en presencia de A resulte mayor que en su ausencia. 
A esto puede denominársele “superstición sensorial positiva”. Si, por otra parte, resulta que los 
reforzamientos se administran con una frecuencia relativamente menor en presencia de A, se desarrollará 
una discriminación en sentido opuesto, como resultado de la cual la tasa en presencia de A se mostrará 
relativamente baja —un tipo de superstición sensorial negativa. 


Cuando una contingencia accidental ha producido una tasa de respuestas más alta o más baja en presencia 
del estímulo incidental, se sigue un segundo efecto. Si la tasa en presencia de A ha disminuido (debido a que 
los reforzamientos han sido relativamente poco frecuentes), será todavía menos probable que las 
respuestas sean reforzadas en presencia de dicho estímulo. En el caso límite no se emitirá ninguna respuesta 
en presencia de A, debido a lo cual ninguna respuesta será tampoco reforzada en presencia de este 
estímulo. Además, los reforzamientos que, en virtud del programa de intervalo variable, se han puesto a 
disposición del sujeto en presencia del estímulo no serán administrados debido a la falta de emisión de 
respuestas. La primera respuesta que tenga lugar después que A sea retirado, resultará, por lo tanto, 
reforzada, lo cual fortalecerá aún más la discriminación. De modo parecido, cuando la tasa aumente en 
presencia de A, debido a un reforzamiento accidental favorable. Probablemente se obtendrán todos los 
reforzamientos puestos a disposición del sujeto en presencia del estímulo por el programa de intervalo 
variable, y si la condición anterior a la presentación de A había dado lugar a una tasa relativamente baja, 
algunos reforzamientos puestos a disposición del sujeto en aquel momento pueden llegarse a administrar 
después de la aparición de A, fortaleciendo así la discriminación (61, página 308). 


Morse y Skinner hacen resaltar, además, el hecho de que la dirección de la contingencia accidental 
no es necesariamente estable dado que a lo largo de un dilatado período de tiempo es probable 
que las relaciones aleatorias sufran oscilaciones. Por otra parte, el establecimiento de una 
contingencia accidental estará en función de variables tales como la duración del estímulo 
incidental con relación a la longitud de la sesión, el programa de reforzamiento utilizado y el tipo 
de conducta generada. Todos estos factores se combinan para dar lugar a un problema de control 
al que pocos, o ningún experimentador, han prestado atención. 


Las implicaciones del control discriminativo accidental de la clase demostrada por Morse y Skinner 
son esencialmente evidentes en los experimentos en que se usa la técnica de supresión 
condicionada. Cuando un estímulo anterior al shock suprime una línea de base en curso de 
conducta positivamente reforzada, se produce un cambio concomitante en la distribución del 
reforzamiento. Debido a que la tasa de respuesta disminuye en presencia del estímulo anterior al 
shock, se administrarán pocos o ningún reforzamiento en ausencia del estímulo anterior al shock. 
Debido a ello, la situación es óptima para que se desarrolle una correlación cuyo efecto puede 
sumarse al del shock inevitable en el mantenimiento de una baja tasa de respuesta en presencia 


del estímulo anterior al shock. La combinación de estos dos factores resultará aún más acusada si 
un reforzamiento, colocado a disposición del sujeto durante el estímulo anterior al shock, pero 
que no se haya llegado a administrar debido a la baja tasa de respuestas, es administrado 
inmediatamente después de la terminación del estímulo. 


El mismo tipo de consideraciones resultan adecuadas cuando sometemos una contingencia de 
castigo a un control por estímulos. Si se hace que una respuesta de línea de base positivamente 
reforzada produzca la administración de un shock en presencia de un estímulo dado, la baja tasa 
de respuesta resultante durante este estímulo se correlacionará automáticamente con una baja 
tasa de respuesta. Esta correlación puede contribuir, por sí misma, al mantenimiento de la tasa 
baja. El hecho de que estas correlaciones puedan, o no, controlarse y eliminarse, o que incluso sea 
deseable hacerlo, constituye, por el momento, una cuestión de especulación. 


HISTORIA CONDUCTUAL 


La conducta de un organismo se halla determinada tanto por sus experiencias pasadas como por la 
situación del momento, y los psicólogos experimentales han dedicado mucho esfuerzo a la 
investigación de los factores históricos, así como a una delineación más precisa de los mismos. 
Los estudios sobre la extinción, estados de transición, efectos acumulativos de ciertas variables, 
etc., caen todos dentro de una categoría. Una de las principales ventajas de utilizar animales 
inferiores como sujetos experimentales reside en la relativa facilidad de controlar su historia 
conductual y de conferirles de un modo experimental cualquier historia que se juzgue pertinente a 
una investigación dada. 


A medida que los psicólogos experimentales han aumentado su confianza en sus técnicas de 
control, han comenzado a ascender en la escala filogenética, utilizando en sus experimentos 
especies más avanzadas tales como monos, chimpancés y seres humanos. Estos esfuerzos han 
tenido un gran éxito en varias áreas de investigación, aunque el uso experimental de especies más 
avanzadas ha dado lugar a nuevos problemas. El problema pertinente a la discusión que nos ocupa 
es la acusada variabilidad entre sujetos que se observa en organismos superiores. Gran parte de la 
variabilidad se deriva de la considerable y, en general, desconocida historia conductual que los 
organismos superiores traen consigo al laboratorio. Los monos y chimpancés suelen haber pasado 
un cierto número de años en su hábitat natural antes de ser sometidos a estudio experimental. 
Los seres humanos no sólo llegan al laboratorio con una historia desconocida, sino que continúan 
ampliándola si el experimento es a largo plazo, dado que no suelen permanecer en un ambiente 
controlado de laboratorio durante un estudio considerablemente largo. 


Existen dos factores principalmente responsables de las ampliaciones técnicas y sistemáticas que 
se han llevado a cabo con éxito desde los organismos inferiores a los superiores, a pesar del 
aumento de variabilidad en la historia conductual. El primero de ellos es la utilización de variables 
experimentales lo suficientemente poderosas para contrarrestar los efectos de los factores 
históricos incontrolados. Así, por ejemplo, se escogen los valores de los parámetros de línea de 


base que se sabe producen una resistencia máxima a la interferencia por parte de variables 
extrínsecas; se utilizan reforzadores para los cuales existe una historia de deprivación; se 
mantienen la frecuencia de reforzamiento tan alta como lo permita la compatibilidad con la 
longitud deseada del período de observación, y se seleccionan tipos y valores de programas de 
reforzamiento que reduzcan al mínimo la aparición de formas de conducta distintas a aquellas que 
se observan. 


En ocasiones es posible, al seleccionar un reforzador, hacer uso de la historia del sujeto a fin de 
lograr que trabaje a favor, y no en contra, de la aplicación del control experimental. Quizás sea 
factible aprovechar las peculiaridades de la historia de un sujeto, o tal vez existan reforzadores 
culturalmente determinados con una considerable generalidad de uno a otro sujeto. Lindsley, al 
trabajar con adultos psicóticos, ha descubierto que es posible determinar empíricamente el tipo 
de reforzador que resulta más eficaz para sus sujetos ondividuales.** Para algunos sujetos quizás 
los cigarrillo resulten el reforzador más eficaz, para otros lo sea el dinero, y en otros casos tal vez 
lo sean las fotografías de desnudos, dependiendo del individuo que resulten más útiles las 
fotografías de hombres o de mujeres. Del mismo modo, se ha observado que otros sujetos 
responden con la máxima adecuación cuando su conducta tiene como consecuencia poder dar de 
comer a un gatito hambriento. A pesar de que los factores de la historia de un sujeto que 
determinan la eficacia relativa de distintos reforzadores plantean un problema fascinante, el 
investigador puede hacer uso de ellos para aumentar su control experimental incluso sin llegar a 
comprenderlos totalmente. 


Algunos experimentadores utilizan reforzadores que probablemente deban su eficacia a unos 
antecedentes de experiencia relativamente constantes en la cultura de la cual proceden los 
sujetos. Estos antecedentes suelen denominarse, en lenguaje vulgar, con nombres tales como 
competividad, respeto a sí mismo, afán de superación, deseo de complacer, etc. Estos nombres no 
tienen, desde luego, ningún valor explicativo, pero los fenómenos que intentan describir pueden 
aprovecharse eficazmente para someter a control experimental la conducta de organismos 
superiores. Es evidente que una investigación directa de estos fenómenos aumentará el grado de 
rigor con que podremos hacer extensivas nuestras técnicas de control a organismos superiores, ya 
que por más eficaces que sean no podemos estar enteramente satisfechos si contienen elementos 
que no se han comprendido a fondo. 


Además de la utilización de variables de línea de base poderosas, un diseño cuidadoso de la 
situación experimental puede contribuir a reducir al mínimo los efectos de historias conductuales 
diferentes. Los factores históricos se inmiscuirán en una situación hasta el punto en que los 
estímulos que se presenten en la situación experimental se parezcan a aquellos que existen en la 
historia del sujeto. El investigador debe ser lo suficientemente ingenioso para diseñar su ambiente 
y procedimientos experimentales de modo que los estímulos físicos resulten tan distintos como 
sea posible de los que el sujeto pueda haber encontrado con anterioridad, y a pesar de ello 
garantizar la suficiente flexibilidad para permitir una manipulación de los mismos principios 
conductuales que gobiernan la conducta fuera del laboratorio. El control por estímulos en el 
marco de la situación experimental debe reducir al mínimo el grado de generalización de los 


estímulos que utilice con los del mundo exterior, y, a pesar de ello, continuar permitiendo la 
observación de principios generales. 


Nos enfrentamos aquí con el viejo problema de la limitación del laboratorio frente a la generalidad 
de principios, cuya solución exigirá del experimentador una precaución extremada. Utilizando 
sujetos humanos adultos resulta lógicamente imposible someter su conducta completa y 
únicamente al control de variables momentáneas, dado que cuando una persona ha llegado a 
adulta, su conducta se halla bajo el control de variables demasiado complejas para ser extirpadas 
por métodos permisibles en un laboratorio psicológico. Sin embargo, pueden obtenerse datos 
consistentes y generalizables por medio de un control por estímulos combinados, así como 
mediante la selección de parámetros de línea de base poderosos. Las situaciones experimentales 
descritas hasta aquí han sido relativamente simples. Sin embargo, al menos han cumplido con la 
útil función técnica de proporcionar métodos para obtener un control experimental de la conducta 
de organismos superiores, incluso en presencia de historias conductuales ya existentes. Tomando 
como base las situaciones más simples, resulta posible abarcar fenómenos cada vez más 
complejos. 


Mientras que las técnicas para eliminar los efectos de una historia conductual incontrolada 
constituyen un importante avance, no proporcionan la solución final al problema del control. 
Como muchas de las variables que he discutido, la historia conductual no puede eliminarse de una 
consideración sistemática, puesto que debido a su inevitable presencia constituye un factor que 
debe estudiarse por su propio interés. En un estudio determinado del avance sistemático puede 
resultar conveniente retirar los factores históricos de la escena, pero a la larga deberemos evaluar 
estos factores y tomarlos en consideración al describir sistemáticamente la conducta. 
Una evaluación exhaustiva de todos ellos también permitirá un control máximamente eficaz, dado 
que en este caso, aun cuando resulte imposible eliminar los efectos de la historia conductual, 
seremos capaces de especificarlos adecuadamente. Un control llevado a cabo por medio de la 
evaluación es siempre más eficaz y más satisfactorio que un control por exclusión. 


PROCESO A LARGO PLAZO 


Existen algunas variables que, debido a su propia naturaleza, requieren que transcurra un período 
de tiempo relativamente largo para que sus efectos sobre la conducta puedan ser observados. No 
me refiero simplemente a procesos de aprendizaje gradual que pueden estar implicados en la 
adaptación de la conducta a una nueva variable, sino al hecho de que debe transcurrir un período 
de tiempo largo antes de que siquiera podamos decir que el sujeto ha sido expuesto a la variable 
en cuestión. La tasa de reforzamiento, por ejemplo, es, por definición, una variable de esta clase. 
El sujeto debe recibir un gran número de reforzamientos antes de que su tasa de administración 
influya y supere los efectos ejercidos por cualquier intervalo entre reforzamientos aislada. Ange ha 
demostrado, por ejemplo, que los tiempos entre respuestas largos raramente se producen en 
ciertos programas de reforzamiento de intervalo variable, debido a que estos tiempos entre 
respuestas hacen disminuir la tasa de reforzamiento.* Un factor como éste intrínsecamente 
requiere que transcurra un largo período de tiempo antes de que pueda afectar la conducta. 


La frecuencia de shocks, por ejemplo, es un tipo de variable similar. En general, cualquier 
acontecimiento debe producirse un considerable número de veces para que pueda llegar a 
constituirse en un factor controlante de la conducta, no porque el sujeto tal vez necesite que pase 
mucho tiempo para aprender la tasa con que se produce, sino porque dicha tasa no puede siquiera 
llegar a especificarse a no ser en un período de tiempo dilatado. 


¿En qué punto podemos decir que el sujeto ha sido expuesto a una determinada tasa de 
reforzamiento, por ejemplo? No existe una respuesta rotunda a esta pregunta en términos de las 
técnicas de aplicación momentánea de que se dispone. Sólo podemos observar la conducta para 
determinar si resulta afectada por la tasa de reforzamiento, y si este efecto ha llegado a 
estabilizarse. El tipo de observación conductual que llevemos a cabo dependerá del procedimiento 
particular que empleemos en un experimento dado, pudiendo basar dicha observación en una 
simple inspección de las curvas acumulativas de respuesta, de las frecuencias relativas o de otras 
mediciones conductuales usuales. O quizás sea necesario, como en la investigación de Anger, 
llevar a cabo algunas operaciones de medición y control relativamente minuciosas y complicadas. 


La tasa de reforzamiento y otras variables de la misma clase pueden ser de interés en cualquiera 
de estos dos sentidos: quizás no interese, simplemente, especificar y estabilizar los efectos de la 
tasa de reforzamiento, o quizás deseemos manipularla como una variable experimental. En el 
primer caso, no tenemos otra alternativa que dar tiempo al tiempo y esperar a que nuestras 
observaciones conductuales nos indiquen que la variable en cuestión ha llegado a controlar la 
conducta. Sin embargo, sería tedioso y caro repetir este período de espera cada vez que 
manipuláramos la tasa de reforzamiento como una variable experimental. Ello nos plantea, por lo 
tanto, nuestro segundo problema. ¿Existe alguna forma de acortar el tiempo requerido para 
estudiar los efectos ejercidos por variaciones de variables que actúan a largo plazo, tal como la 
tasa de reforzamiento? 


Las técnicas de control por estímulos pueden proporcionar la solución a este problema, dado que 
si podemos colocar la frecuencia de reforzamiento bajo un control por estímulos exteroceptivos, 
solamente deberemos cambiar uno de los estímulos para observar, de un modo inmediato, los 
efectos ejercidos por distintas frecuencias de reforzamiento. Para ello, se debería someter el 
sujeto a un entrenamiento previo, el cual implicaría exponerlo a la gama de tasas de 
reforzamiento deseada, o a cualquier otra variable de actuación a largo plazo en que estuviéramos 
interesados. Sin embargo, cada valor de la variable se pondría en correlación con un estímulo 
distinto, de modo que, en presencia de un color, por ejemplo, la frecuencia media de 
reforzamiento sería de uno por minuto; en presencia de otro color, esta frecuencia sería de dos 
por minuto, procediéndose de un modo análogo con toda la gama de valores a los cuales se 
deberá exponer el sujeto. 


Una vez establecido satisfactoriamente el control por estímulos, la conducta cambiará 
apropiadamente tan pronto como se altere el color del estímulo que en aquel momento estaba 
presente, juntamente con su frecuencia de reforzamiento correspondiente. Gracias a ello 
dispondremos de una herramienta, constituida por una línea de base de elementos múltiples, por 


medio de la cual podremos estudiar los efectos ejercidos por la frecuencia de reforzamiento en 
combinación con otras variables. 


Durante la fase correspondiente al entrenamiento previo del sujeto, puede acelerarse la 
adquisición de un control inmediato por los distintos estímulos haciendo que cada cambio 
operado en la frecuencia de reforzamiento sea radical, de modo que la conducta refleje los efectos 
de dicho cambio apenas se produzca. Sin embargo, el establecimiento de una línea de base de 
elementos múltiples puede requerir un tiempo considerable, dependiendo de cuán largo sea el 
período durante el cual el sujeto debe estar expuesto a una frecuencia de reforzamiento 
determinada para que ésta llegue a controlar su conducta. A pesar de ello, esta herramienta 
puede resultar de tan gran utilidad que justifique plenamente el esfuerzo inicial. Se sabe tan poco 
acerca de la acción de las variables que actúan a largo plazo, y resultan tan prometedoras, que una 
investigación intensiva en este sentido probablemente resultará interesante y útil al mismo 
tiempo. 


Existe un segundo tipo de procesos a largo plazo que se halla estrechamente relacionado con 
nuestras anteriores discusiones sobre contingencias accidentales y su implicación en el 
aprendizaje. Debido a las correlaciones accidentales, es posible que una contingencia que 
hayamos dispuesto experimentalmente continúe modelándose a sí misma con el transcurso del 
tiempo. Este proceso de modelamiento no tiene por qué ponerse de manifiesto, necesariamente, 
en nuestras mediciones de línea de base, sino que quizá se manifieste en forma de variabilidad 
cuando la línea de base sea manipulada experimentalmente. 


Cuando disponemos una contingencia entre una respuesta y una consecuencia ambiental, suele 
aparecer una amplia clase de variaciones en el ámbito de la respuesta que satisfarán la 
contingencia en cuestión. Esta clase de variaciones define una operante. Sin embargo, el intervalo 
de variación de la respuesta, dentro de la operante de que se trate, se halla, a su vez, sujeto a las 
modificaciones ejercidas por cierto número de factores. Así, por ejemplo, aquellas variaciones que 
requieran un gasto de energía innecesario tenderán a desaparecer. Para que este proceso llegue a 
completarse, sin embargo, será necesario que transcurra un cierto tiempo, dado que las 
respuestas emitidas con un exceso de energía también satisfacen la contingencia y obtienen 
reforzamiento. Del mismo modo, la topografía de la respuesta tenderá a aproximarse a una forma 
de conducta que permita la máxima rapidez en conseguir el reforzamiento una vez que se haya 
emitido la respuesta. Este proceso resulta igualmente lento debido a que formas de conducta 
relativamente ineficaces también son reforzadas, y debido, asimismo, a que la respuesta 
máximamente eficaz quizá no se produzca hasta que el experimento esté muy avanzado. Otras 
características de la respuesta que no sean necesarias para satisfacer la contingencia pueden 
persistir durante mucho tiempo simplemente porque acompañan a la conducta reforzada, y es 
probable que ésta no llegue a desprenderse de aquellas características innecesarias hasta que se 
hayan producido varios reforzamientos en su ausencia. 


Un proceso automático de modelamiento puede extenderse, pues, a lo largo de un período de 
tiempo considerable, en el que la conducta se irá canalizando gradualmente hacia la forma de 


respuesta que más eficazmente satisfaga la contingencia de reforzamiento. Todas las variaciones 
que tienen lugar en la topografía de la respuesta contribuyen a alcanzar este punto de estabilidad 
final. Este proceso resulta claramente visible cuando la contingencia de reforzamiento es 
accidental, dado que la conducta inicial, accidentalmente condicionada, se va modificando 
gradualmente a medida que se acumulan pequeñas variaciones, de modo que la respuesta que 
prevalezca en un estadio avanzado del experimento quizás no se asemeje en absoluto a la forma 
original de dicha respuesta.*? este proceso permanece abierto, sin llegar necesariamente a un 
estado final, dado que la contingencia accidental no establece un relación consistente entre la 
conducta y el reforzamiento a través del cual pueda seleccionarse una respuesta estable. 


Los procesos de modelamiento automático a largo plazo plantean un problema de control, debido 
a que entorpecen nuestra definición de la muestra conductual que estamos investigando. Si esta 
muestra cambia a medida que transcurre el tiempo, podemos encontrarnos con que no estemos 
aplicando nuestras operaciones experimentales a la misma conducta, lo cual nos sitúa en el 
problema más amplio de la definición de una respuesta. Nos hemos acostumbrado a solucionar 
este problema en términos del concepto de Skinner de operante, que supone la equivalencia de 
todas las conductas que produzcan las mismas consecuencias bajo el mismo control por 
estímulos.% La utilidad de este concepto no puede ponerse en duda, ya que gracias a él ha sido 
posible observar un grado de regularidad sin precedentes en la conducta. El hecho de haber 
identificado la operante con la unidad de respuesta ha constituido la concepción unificadora más 
poderosa en el estudio de la conducta. 


Sin embargo, estamos alcanzando el estadio, posibilitado por nuestro considerable desarrollo 
técnico y sistemático, en que podemos colocar bajo examen experimental fenómenos complejos y 
sutiles que antaño era inimaginable poder traerlos al laboratorio. Una mayor minuciosidad en los 
fenómenos conductuales que investiguemos debe ir acompañada por una mayor minuciosidad y 
rigor en el control experimental. Probablemente no podamos continuar ignorando las variaciones 
que se producen en la topografía de una respuesta dentro de una clase operante, especialmente 
cuando los fenómenos que se investigan requieren una evaluación cuantitativa. Si nos aferramos 
con demasiada rigidez a la suposición de que los componentes de una unidad operante son 
equivalentes en todos sus aspectos, es probable que no podamos apreciar, y por consiguiente 
controlar, las principales fuentes de variabilidad que surjan en nuestros estudios de fenómenos 
conductuales sutiles. 


Una manera de enfocar este problema consiste en especificar la operante en términos de la 
propiedad conductual que se mide, y dado que estamos acostumbrados a calificar de operante la 
conducta de apretar una palanca, sugiero que se clasifiquen como operantes distintas ciertos 
aspectos medibles de dicha conducta de apretar la palanca, tales como su tasa de emisión, 
latencia, energía, etc. De esta forma, una tasa de respuestas a la palanca de cinco por minuto sería 
una operante, mientras que una tasa de respuestas de diez por minuto sería una operante 
distinta. De esta forma, es posible hacer que el reforzamiento sea contingente a un valor, 
especificado de antemano, de algún aspecto de la conducta, y tratar este valor como una 
respuesta por derecho propio. 


Tal limitación de la clase operante puede ayudar, lógicamente, a reducir a un mínimo los 
problemas planteados por los procesos de automodelación a largo plazo. Sin embargo, ello sólo 
será posible si la especificación conceptual va acompañada de una especificación correspondiente 
del control experimental. Si la clasificación operante debe restringirse a una respuesta que se 
emite con una frecuencia, o con una latencia, dada, por ejemplo, deberá restringirse también, por 
consiguiente, la contingencia de reforzamiento, así como el control por estímulos utilizado. 
Gracias a ello, y en la medida en que una restricción de este tipo limite el tamaño de la clase 
conductual que puede entrar en las contingencias, habremos reducido el tiempo requerido para la 
consecución del modelamiento automático. 


Probablemente no sea ésta una solución definitiva al problema del control, existe al menos otra 
desventaja aparejada a una restricción excesiva de la muestra conductual con que debemos 
trabajar. Cuanto más severa sea la limitación impuesta, menos probable será que la operante se 
emita con fuerza apreciable inicialmente, y tanto más difícil será establecer su participación en 
una contingencia controlada experimentalmente. A menos que la conducta se emita, para 
empezar, con una frecuencia apreciable, no tendremos ocasión de someterla a un control 
experimental sin antes comprometernos en un programa de modelamiento deliberado. En la 
mayoría de los casos, el problema planteado por los procesos a largo plazo continuará estando 
presente. 


Sin embargo, quizás sea éste el camino a seguir, ya que resultados imprevistos pueden destruir la 
relevancia de mi crítica. Así, si deseáramos utilizar un programa de razón fija de, por ejemplo, 50:1 
tal vez deberíamos reforzar, no sólo una de cada cincuenta respuestas a la palanca, sino una de 
cada cincuenta respuestas que se emitieran con una fuerza de 20 gramos y una duración de 0,1 
segundos. Es muy posible que emerjan nuevos tipos de regularidades de una restricción de este 
tipo, los cuales traerán aparejados sus propios problemas de evaluación de datos. 


Apéndice 
Nota terminológica 


La mayoría de los textos sobre metodología científica toman sus ejemplos de las ciencias físicas o 
de campos de la biología distintos de la psicología. Por esta razón, las referencias que aparecen en 
este libro a problemas, técnicas y datos conductuales incluyen términos que sin duda resultarán 
desconocidos para muchos lectores. El propósito de esta nota terminológica es esclarecer el 
suficiente número de términos de forma que el lector pueda sacar el máximo provecho posible de 
los ejemplos y seguir los razonamientos sin interrupciones. No me he propuesto, en modo alguno, 
incluir todos los términos psicológicos, sino solamente aquellos que aparecen en este libro. 


INSTRUMENTAL 


Al inducir un organismo en el laboratorio para estudiar su conducta, el psicólogo se enfrenta de 
inmediato con una serie de problemas prácticos. Si el sujeto del experimento no es un ser 
humano, debería contarse con un espacio adecuado donde albergarlo, tanto antes de empezar el 
experimento como durante los intervalos entre sesiones experimentales. La mayor parte de los 
sujetos animales poseen, pues, una jaula-hogar. 


Comida y agua pueden, o no, estar a disposición del animal en su jaula-hogar, según el tipo de 
investigación a que el sujeto sea sometido; también puede darse el caso de que el animal 
solamente disponga de comida y agua en momentos prefijados. La especificación de dicha 
disponibilidad de agua y comida recibe el nombre de programa de deprivación.” Así, pues, un 
programa de deprivación de comida de 23 horas, por ejemplo, indica que por cada hora que el 
animal tiene acceso a la comida e su jaula-hogar, transcurren 23 horas durante las cuales no come 
nada. 


Surge entonces le problema de seleccionar un espacio experimental que el sujeto ocupará 
mientras se lleve a cabo el experimento. La experimentación en el laboratorio conlleva un cierto 
grado de limitación, tanto de la actividad del sujeto como de los tipos de observación posibles al 
experimentador. Al colocar un sujeto en un recinto cerrado, el experimentador restringe su área 
de actividad, aunque no su libertad de movimiento dentro de la misma. Las dimensiones del 
espacio experimental lógicamente dependen del tamaño del sujeto — relativamente grande para 
acomodar a un chimpancé o un ser humano, y más reducido para un ratón. 


Normalmente, los sujetos permanecen en el espacio experimental durante un intervalo de tiempo 
limitado, al que se aplica el término de sesión experimental. El experimento en sí puede ocupar 


* Traducimos el término inglés “deprivation” por la palabra “deprivación”, a pesar de que V. A. Colotla y X. 
Gallegos de Colotla han sugerid el término, existente en castellano “privación” (Ver N. del T., página 155). 
Hemos creído oportuno acuñar esta palabra, en vez de utilizar la propuesta por dichos autores, con objeto 
de diferenciar claramente la operación experimental deliberada, consistente en dejar un sujeto sin comida o 
bebida durante un cierto tiempo, de los significados más generales que vulgarmente se asocian con el 
término “privación” N. del T.) 


numerosas sesiones, en cuyo caso el sujeto pasará los períodos entre sesiones consecutivas en su 
jaula-hogar o, si es un ser humano, en un ambiente normal. 


Al registrar los efectos que sus operaciones experimentales producen sobre un aspecto 
previamente seleccionado de la conducta del sujeto, el investigador limita necesariamente el 
ámbito de sus observaciones. A veces, la conducta seleccionada para su observación puede poseer 
su propio interés, como en el caso de la conducta de aparejamiento. En la mayor parte de las 
investigaciones que he usado como ejemplos ilustrativos, la respuesta concreta cuyas 
características deberán registrarse carece de interés intrínseco. Seleccionada arbitrariamente 
como ejemplo de la conducta del organismo, cumple, presumiblemente, las mismas leyes que 
cualquier excepción, por el mero hecho de serlo, sugiere sencillamente la necesidad de un estudio 
más detenido. 


Cuál de entre las distintas respuestas del organismo debe ser seleccionada para su observación 
normalmente se decide teniendo en cuenta factores de conveniencia, tanto por parte del 
organismo experimental como del experimentador: preferimos una respuesta que no requiera un 
esfuerzo excesivo y cuya repetición no fatigue al organismo —a no ser, claro está, que el esfuerzo o 
la fatiga sean precisamente el objeto de estudio—; además, las características relevantes de dicha 
respuesta deberán ser fácilmente registrables y de naturaleza tal que el propio proceso de 
observación no interfiera con ellas apreciablemente. Por razones obvias, como veremos más 
adelante, debe evitarse al máximo cualquier influencia innecesaria sobre la tasa de respuesta del 
sujeto. 


Con un organismo tal como al paloma, la respuesta de picar ha resultado ser a que mejor cumple 
con estos requisitos. Sobre una pared del espacio experimental, se monta un pulsador translucido, 
llamado simplemente disco. Cuando el pájaro pica sobre el disco, la presión ejercida actúa sobre 
un interruptor que a su vez envía un impulso eléctrico al equipo registrador y demás aparatos 
utilizados en la programación de experimentos. Naturalmente, la paloma está bien equipada 
biológicamente para producir la respuesta de picar; picotea con facilidad y rapidez, y, tras picar 
sobre disco una vez, está en disposición de repetir la respuesta inmediatamente. El registro de las 
respuestas se resuelve conectando el disco a un conmutador lo suficientemente sensible. 
Una característica adicional del disco es su translucidez, que permite una iluminación 
policromática, mediante las luces de disco. También pueden proyectarse numerosos tipos de 
esquemas visuales, tales como puntos de varios tamaños, figuras geométricas, distintas 
intensidades de luz, etc. Véase, por ejemplo, la figura 22. Las luces del disco cumplen las funciones 
de estímulos en ciertos procedimientos experimentales. 


No debe confundirse esta luz de disco con la luz de caja, fuente de iluminación general para el 
espacio experimental, que puede utilizarse también como estímulo. Normalmente, encendiendo a 
luz de caja que se indica al sujeto que empieza la sesión experimental; apagándola, le indicamos el 
fin de la misma. 


Los discos para las palomas también han resultado eficaces con ratas, las cuales ejercen presión 
sobre el disco con su hocico. Hasta hace poco tiempo, al experimentar con ratas y otros pequeños 


mamíferos, se ha usado más frecuentemente una palanca que el animal aprieta. Dicha palanca 
consiste en una varilla de metal que, colocada dentro de un espacio experimental, se proyecta 
parcialmente al exterior a través de una pared del mismo. Cuando el sujeto aprieta la palanca, con 
fuerza suficiente, haciéndola descender una distancia adecuada, se acciona un interruptor que 
envía un impulso eléctrico a los aparatos de registro y programación. Cualquier conducta 
mediante la cual el sujeto logre accionar el interruptor contará como una “respuesta de aprender 
la palanca”, que aquí dominaremos simplemente respuesta a la palanca. 


En realidad, apretar la palanca constituye una respuesta hasta cierto punto común en monos, 
chimpancés y seres humanos, acostumbrados a manipular objetos. Además de una palanca, o a 
veces, en su lugar, el espacio experimental de un mono puede incluir una cadena que pende del 
techo. Cada vez que el mono tira de la misma, ésta acciona un interruptor, y, en este caso, se 
registra la respuesta a la cadena. 


Colocados en un espacio experimental, los sujetos aprietan palancas, pican discos, tiran de 
cadenas, etc., debido a que sus respuestas producen ciertas consecuencias. Por ejemplo, apretar 
la palanca puede reportar comida a un mono. Si el animal ha sido previamente sometido a un 
programa de deprivación y tiene hambre durante la sesión experimental, predominará la conducta 
consistente en apretar la palanca. Es decir, la aparición de comida como consecuencia de apretar 
la palanca aumenta la probabilidad de que el sujeto la apriete de nuevo. Se denomina 
reforzamiento a todo acontecimiento que, contingente a una respuesta del organismo, altera la 
probabilidad de dicha respuesta. 


La comida es, probablemente, el tipo de reforzador más frecuentemente utilizado en el 
laboratorio conductual. No es que el psicólogo esté generalmente interesado en la “conducta de 
conseguir comida” o en el comportamiento de comer, como tales, sino que usa el reforzamiento 
en forma de comida como una técnica conveniente para generar y mantener una muestra de la 
conducta del organismo de forma que pueda ser estudiada. En la sección dedicada a 
reforzamiento, describiré algunas de las formas en que puede utilizarse el reforzamiento para 
generar y mantener la conducta de un organismo experimental. 


Montado exteriormente a una de las paredes del espacio experimental suele haber un mecanismo 
automático administrador de comida. Si la comida utilizada como reforzador se administra en 
forma de gránulos sólidos, el mecanismo administrador de comida, al ser accionado, deja caer un 
gránulo a través de un tubo cuyo extremo inferior se encuentra el comedero, permitiendo que la 
comida sea accesible al animal. Cuando se utilizan palomas, el reforzador suele ser grano, que es 
expuesto al ave, durante un número prefijado de respuestas de segundos mediante un mecanismo 
accionado por un electroimán. Si el reforzamiento se administra en forma de agua o de alimento 
líquido, el bebedero estará formado por un tanque lleno de líquido en el que se halla sumergida 
una cazoleta, que un motor o un electroimán hace subir o mantiene al alcance del animal durante 
un corto período de tiempo para cada reforzamiento. La magnitud del reforzamiento puede 
controlarse por el tamaño del gránulo, por el período de tiempo que el grano o el líquido están a 


disposición del animal, o por la concentración de substancias alimenticias en la substancia utilizada 
como reforzador. 


Se usan también otros tipos de reforzamiento en el control experimental de la conducta. 
El espacio experimental posee a menudo un suelo consistente en una reja o parrilla, formado de 
varillas metálicas a través de las cuales pueden administrarse shocks eléctricos al sujeto. En este 
caso, toda respuesta que permita al organismo escapar del shock eléctrico o impedir que éste 
tenga lugar, resultará reforzada. Cuando dicha conducta pone término a un shock eléctrico 
presente, recibe el nombre de conducta de escapada, mientras que a conducta que logra que el 
shock no llegue a ser administrado, se denomina conducta de evitación. 


Constituye otro tipo de reforzamiento importante, aunque menos frecuente, la estimulación 
eléctrica intracraneal. Mediante procedimientos quirúrgicos adecuados, el experimentador inserta 
electrodos metálicos a través del cráneo del animal en determinadas áreas de su cerebro, en cuyo 
caso hablamos de electrodos implantados. Una vez que el animal se halla dentro del espacio 
experimental se conectan los electrodos implantados a una fuente de corriente eléctrica, 
mediante hilos conductores que pasan a través de un interruptor accionado por la respuesta del 
sujeto. Cada vez que el sujeto responde —apretando la palanca, por ejemplo— una corriente 
eléctrica fluye a través de aquella región del cerebro en la cual han sido implantados los 
electrodos. De este modo, el animal estimula su propio tejido cerebral. Si los electrodos han sido 
correctamente implantados, esta autoestimulación reforzará la conducta del animal, aumentando 
la probabilidad d que éste responda nuevamente. Las características de esta conducta 
autoestimulativa pueden, además, modificarse mediante las mismas operaciones efectuadas en el 
reforzamiento con comida que describiré más adelante. 


Además de los estímulos visuales, proporcionados por las luces de caja y de disco, también pueden 
presentarse al sujeto estímulos auditivos a través de un altavoz situado ya sea cerca del espacio 
experimental o dentro de él. Un estímulo auditivo puede presentarse en forma de tono continuo o 
bien en forma de una serie de “clics”. Con objeto de enmascarar otros sonidos procedentes de los 
mismos aparatos y que podrían producir interferencias en el proceso experimental, suele 
exponerse el espacio experimental a una fuente de ruido blanco, constituido por una amplia gama 
de frecuencias. 


TÉCNICAS DE REGISTRO 


El psicólogo experimental estudia las leyes que describen la probabilidad de que un organismo 
responda de un modo determinado. Antes de describir las operaciones llevadas a cabo por el 
experimentador con el fin de variar la probabilidad de respuesta del sujeto, es aconsejable 
exponer primero los métodos empleados en el registro de la conducta. 


EL REGISTRO ACUMULATIVO.- Un indicador de la probabilidad de una respuesta es la frecuencia 
con que ocurre. Por ejemplo, ¿cuántas veces responde el sujeto cada minuto? El registrador 
acumulativo nos proporciona una representación visual continua de la tasa de respuesta del 
sujeto. Esencialmente, el registrador consiste en un mecanismo parecido al quimógrafo, con una 


banda de papel que se desplaza a velocidad constante por medio de un motor eléctrico y sobre la 
cual se apoya una plumilla. Mientras el organismo no responde, la plumilla traza una línea recta 
paralela a la dirección en que se mueve el papel. E el momento en que el sujeto responde —aprieta 
una palanca, pica un disco o emite cualquier conducta que se haya decidido registrar—, la plumilla 
se desplaza un corto trecho perpendicularmente a la dirección en que se mueve el papel. 
El resultado es una curva como la de la figura 6. La pendiente de la curva es proporcional a la tasa 
de respuesta del sujeto. Un segmento recto de la curva indica que el sujeto no respondió en 
absoluto durante el período en que se llevó a cabo el registro. Una pendiente grande significa que 
el sujeto respondió a una frecuencia de elevada. La altura de la curva en un punto determinado 
nos indica el número total de respuestas efectuadas por el sujeto hasta aquel momento. 


Por el hecho de desplazarse la plumilla en una sola dirección con cada respuesta, la curva resulta 
acumulativa. Si el sujeto responde las veces suficientes para hacer llegar la plumilla al borde del 
papel, ésta se desplaza automáticamente a la posición original, quedando dispuesta para una 
nueva ascensión (véase la figura 5). Cuando la duración del experimento es considerable, puede 
recortarse cada una de las ascensiones completas de modo que permita una mayor contigúidad y 
compacticidad, por ejemplo, al elaborar un informe. Este sencillo proceso se ilustra en la figura 26. 


Además de la medición de la tasa de respuesta, ciertos accesorios del registrador acumulativo 
permiten obtener otros tipos de información. Por ejemplo, un impulso eléctrico adecuado hará 
que la plumilla se desplace ligeramente en dirección oblicua al movimiento que efectúa 
normalmente. Cuando la plumilla se desplaza sólo momentáneamente, puede indicar el punto en 
que el sujeto recibió un reforzamiento, como en la figura 7, o un shock eléctrico, como en la figura 
16. En la figura 5 la plumilla se mantiene en posición desplazada durante varios minutos, indicando 
el lapso mediante el cual es presentado un estímulo al sujeto. La línea horizontal durante este 
período nos indica que el sujeto no respondió en presencia del estímulo. 


Como hemos visto, la plumilla vuelve automáticamente a su posición de partida cada vez que 
alcanza el borde opuesto del papel. No obstante, también se puede hacer que descienda a su 
posición original, mediante un impulso eléctrico en cualquier punto de su itinerario. 
Como muestra la figura 29, esto se hace, por ejemplo, cuando interesa separar los datos obtenidos 
en distintos estadios de un procedimiento experimental. 


Cuando un procedimiento experimental implica dos respuestas en vez de una, pueden usarse dos 
registradores acumulativos simultáneamente. Los registros separados así obtenidos pueden luego 
colocarse sobre unas mismas coordenadas, facilitando así su comparación. Véase la figura 24. 


Debe hacer resaltar que, en un sentido muy real, el registro acumulativo es dibujado directamente 
por el sujeto. Aparte de la elección de coordenadas, dadas por la velocidad del papel y el trecho 
que recorre la plumilla con cada desplazamiento, el experimentador no efectúa ninguna 
transformación en los datos. Se obtiene, por lo tanto, un registro directo de la conducta del sujeto, 
constituyendo además un registro inmediato de la misma que permite al investigador evaluar, en 
todo momento, el curso de su experimento mientras éste se desarrolla. 


TIEMPOS ENTRE RESPUESTAS.- El valor recíproco de la tasa media de respuesta nos indica el 
intervalo medio de tiempo que transcurre entre respuestas sucesivas, o tiempo entre respuestas 
medio. Puede ser de interés conocer cuánto tiempo transcurrirá, una vez que el sujeto ha 
respondido, antes de que responda de nuevo. Disponemos de instrumentos de medición que nos 
dan una respuesta estadística a esta pregunta, en forma de distribución de frecuencias de los 
tiempos entre respuestas del sujeto durante una sesión dada, o una porción de la misma. Al final 
de este período, el registrador indicará, por ejemplo, cuántas veces el sujeto ha dejado transcurrir 
de dos a cuatro segundos entre respuestas consecutivas, cuántas veces la pausa ha sido de cuatro 
a seis segundos, de seis a ocho segundos, etcétera. Estos datos constituyen también un índice de 
la probabilidad de respuesta: dada una respuesta en un momento determinado, podemos estimar 
cuándo es probable que tenga lugar la siguiente. 


OTRAS CARACTERÍSTICAS DE LA RESPUESTA.- La tasa de respuesta y el tiempo entre respuestas en 
ningún modo agotan las medidas de probabilidad conductual de que disponemos; no obstante, no 
he mencionado ninguna más en este texto con el fin de simplificar. La conducta posee también 
otras características medibles. Cada respuesta, por ejemplo, ocupa un periodo de tiempo finito 
conocido como duración de respuesta. También puede existir una determinada relación temporal 
con un estímulo previo: el intervalo entre estímulo y respuesta recibe el nombre de latencia de 
respuesta. Una respuesta tal como apretar una palanca o picar un disco requiere que el organismo 
ejerza una fuerza determinada; la intensidad de respuesta es igualmente medible con 
instrumentos adecuados. A veces la conducta se registra sólo de modo indirecto, a partir de sus 
efectos sobre el ambiente. Por ejemplo, el investigador puede registrar el número de 
reforzamientos recibidos por el sujeto, o bien el número que recibe en relación con el total que 
podría recibir si se comportará de un modo perfectamente eficaz. Análogamente, el investigador 
puede registrar el número de shocks que el sujeto logró evitar. 


PROCEDIMIENTOS EXPERIMENTALES 


ADAPTACIÓN AL MECANISMO ADMINISTRADOR DE COMIDA.- Constituye un principio de 
conductual perfectamente establecido el hecho de que un reforzamiento posee la máxima eficacia 
si sigue inmediatamente a una respuesta. Este principio puede formularse como sigue: un 
reforzamiento ejerce su máximo efecto sobre la respuesta inmediatamente anterior a su 
incidencia. En el proceso de instaurar una respuesta determinada en el repertorio conductual de 
un organismo, es esencial, por tanto, asegurarse de que el reforzamiento será recibido por aquél 
tan pronto como responda adecuadamente. La adaptación al mecanismo administrador de comida 
está dirigida a este fin. 


Supongamos que el organismo experimental es un mono; la respuesta seleccionada, apretar una 
palanca; y el reforzamiento, gránulos de comida. Si el animal no ha sido sometido previamente a la 
adaptación al mecanismo administrador de comida, el primer gránulo recibido por él después de 
apretar la palanca probablemente no tendrá el efecto deseado. El ruido del mecanismo 
administrador de comida y la aparición súbita del gránulo en el comedero —si es que el animal 
llega a verlo— probablemente asustarán al mono, el cual huirá al extremo opuesto del espacio 


experimental. Tras una adaptación parcial a estos estímulos, el mono encontrará eventualmente el 
gránulo, y quizá lo coja, en cuyo caso puede que juegue con él un rato, lo tire o bien, por el 
contrario, lo coma. En cualquier caso, esto ocurre bastante después de haber apretado la palanca. 
Desde el punto de vista del mono, las consecuencias de apretar la palanca fueron un ruido 
atemorizador; apretar la palanca y recibir comida carecen de relación. 


Durante la adaptación al mecanismo administrador de comida la palanca no está al alcance del 
animal. Los gránulos se suministran gratis, independientemente de la conducta del mono. La 
desazón inicial acaba por desaparecer, sin haber estado nunca asociada con la respuesta de 
apretar la palanca. La conducta del mono cae bajo control del ruido del mecanismo administrador 
de comida: cada vez que este ruido se produce, el animal interrumpe cualquier otra actividad, 
recoge el gránulo del comedero y lo ingiere. A partir de este momento, se pone la palanca a su 
disposición. Tan pronto el animal la aprieta, se produce el ruido característico del mecanismo, 
aquél toma el gránulo inmediatamente, estableciéndose así la conexión entre apretar la palanca y 
la obtención de comida. Con algunos reforzamientos más la respuesta se instaura firmemente en 
el repertorio conductual del sujeto, a partir de cuyo momento queda en condiciones de ser 
ulteriormente estudiada. 


MODELAMIENTO.- Cuando la palanca se hace accesible al animal, después de la adaptación al 
mecanismo administrador de comida, el experimentador puede limitarse a esperar que aquél la 
apriete, lo que es posible que ocurra gracias a un movimiento casual de o a la tendencia del sujeto 
a explorar y manipular su ambiente. En este caso, el experimentador no tendrá ningún control 
sobre la forma precisa que adoptará la respuesta: puede que el animal apriete la palanca con 
cualquiera de sus dos manos, con su boca o quizás aterrice sobre ella tras un salto en el aire. 
Dependiendo de la ubicación, tamaño, fuerza requerida y otras características de la palanca, 
puede ocurrir que no se repita esta primera respuesta durante algún tiempo. Para lograr 
introducir la respuesta inmediatamente más rápidamente, así como para controlar su forma 
precisa, o topografía, el experimentador modela deliberadamente la respuesta deseada a partir de 
la masa de conducta indiferenciada que emite el animal. 


El modelamiento se lleva a cabo mediante un proceso de aproximaciones sucesivas. Si inicialmente 
el animal permanece casi inmóvil, el experimentador proporcionará un gránulo de comida cada 
vez que el animal se mueva, sin tener en cuenta ningún movimiento en particular. Una vez 
incrementada, mediante los reforzamientos suministrados, la probabilidad de que el sujeto se 
mueva, el experimentador comenzará a concretar el tipo de movimiento que reforzará. 
Gradualmente irá requiriendo del animal que se acerque a la palanca, que se coloque frente a ella, 
que alargue la mano en dirección a la misma cada vez más hasta tocarla y, finalmente, que la 
apriete. De este modo, el animal desarrolla paulatinamente la forma de respuesta deseada; a 
partir de este momento, ésta será la única conducta reforzada. 


PROGRAMAS DE REFORZAMIENTO.- Una vez que el experimentador ha modelado la respuesta 
deseada, continúa proporcionando un reforzamiento al sujeto cada vez que éste la emite. A este 
procedimiento, consistente en reforzar cada respuesta, se aplica el término reforzamiento 


continuo, denominándose adquisición el proceso inicial global mediante el cual el organismo llega 
a ejecutar esta nueva respuesta. Si a continuación el experimentador desconecta el mecanismo 
administrador de comida, de modo que el sujeto no pueda obtener más reforzamientos, la 
frecuencia de la respuesta previamente reforzada irá disminuyendo hasta desaparecer. 
La operación consistente en no reforzar recibe el nombre de extinción, y una respuesta cuya 
frecuencia se ha hecho decrecer por este procedimiento se dice que ha sido extinguida. 


Hay un vasto campo intermedio entre el reforzamiento continuo y la extinción. Una vez que la 
conducta ha quedado bien establecida mediante reforzamiento continuo, ya no es necesario 
reforzar al sujeto cada vez que emite una respuesta. E término genérico empleado para 
denominar el procedimiento por el que reforzamos una respuesta, solamente en algunas 
ocasiones, es reforzamiento intermitente. A su vez, el plan o pauta que se sigue al reforzar 
intermitentemente al sujeto recibe el nombre de programa de reforzamiento. 


Los programas de reforzamiento que voy a describir a continuación, no sólo son eficaces para 
mantener la conducta de un organismo, sino que también le confieren determinadas 
características. Cada programa genera una forma de conducta propia; el examen del registro 
acumulativo obtenido, a menudo permite identificar el programa de reforzamiento que estuvo en 
vigor durante el período en cuestión. 


INTERVALO FIJO.- La disponibilidad del reforzamiento puede ser programada mediante un 
mecanismo de relojería. Supongamos que se ha dispuesto un temporizador para que accione un 
interruptor a los cinco minutos de ponerse en marcha. Al comenzar la sesión, el temporizador 
empieza a funcionar, y durante cinco minutos no se refuerza ninguna respuesta. Las respuestas 
que se producen dentro de este intervalo no tienen ningún efecto: el experimentador 
simplemente las registra. Al cabo de cinco minutos el temporizador se para, cerrándose el 
interruptor. La próxima respuesta que se produzca hará llegar un impulso eléctrico al mecanismo 
administrador de comida, el cual suministrará un reforzamiento. Inmediatamente después se abre 
el interruptor, el temporizador vuelve a ponerse en marcha y durante los próximos cinco minutos 
el organismo no podrá obtener ningún reforzamiento. La primera respuesta que siga a este 
segundo intervalo de cinco minutos será de nuevo reforzada. El ciclo se repite con un 
reforzamiento disponible para el organismo solamente cuando han transcurrido cinco minutos 
desde la última respuesta reforzada. A este programa de reforzamiento se le denomina programa 
de intervalo fijo de cinco minutos. 


Si el organismo está suficientemente deprivado de comida, la magnitud del reforzamiento es 
adecuada y el tipo de comida es de máxima eficacia como reforzador, la conducta de un animal 
puede mantenerse mediante programas de intervalo fijo durante varias horas. La conducta del 
animal atravesará varios estadios, pero al final adoptará ciertas características estables, un 
ejemplo de las cuales puede verse en la figura 18. Inmediatamente después de cada 
reforzamiento, el animal no responde en absoluto, y el registro acumulativo transcurre 
horizontalmente durante esta pausa del post-reforzamiento. Después de la pausa el animal 
empieza a responder, lentamente al principio y luego con creciente rapidez. El período durante el 


cual la tasa de respuesta se va acelerando confiere al registro de conducta de intervalo fijo su 
curvatura característica. La tasa alta y estable subsiguiente a la curvatura y que continúa hasta la 
obtención del reforzamiento se conoce con el nombre de tasa terminal. 


El intervalo fijo no tiene por qué empezar necesariamente con un reforzamiento. De hecho, puede 
empezar en cualquier punto arbitrariamente designado por el experimentador. Después de un 
reforzamiento, por ejemplo, el próximo intervalo puede no empezar hasta que aparezca un 
determinado estímulo. En este caso es evidente que la pausa que se observa al principio del 
intervalo no es la pausa del postreforzamiento, en cuyo caso nos referiremos a ella como 
simplemente pausa de intervalo fijo. 


INTERVALO VARIABLE.- Los reforzamientos pueden ponerse a disposición del sujeto a intervalos 
irregulares en vez de fijos. Un método usual de lograrlo es mediante una cinta perforada, que es 
arrastrada por un motor a velocidad constante. Cada vez que un agujero de la cinta pasa por un 
detector, un interruptor se cierra, dejando al circuito dispuesto para que la próxima respuesta del 
sujeto sea reforzada. La distancia entre agujeros sucesivos en la cinta programadora determina el 
tiempo que debe transcurrir entre reforzamientos sucesivos. Los programas de intervalo variable 
se especifican según el promedio de tiempo que separa reforzamientos consecutivos, y también 
según la distribución de los intervalos entre reforzamientos tal como los programa la cinta. 


Si la cinta programadora de intervalo variable ha sido bien calculada, el organismo responderá con 
una tasa relativamente estable a lo largo de toda la sesión. No aparecerá, por lo tanto, ninguno de 
los ciclos que caracterizan a la conducta de intervalo fijo. 


REFORZAMIENTO DIFERENCIAL DE TASAS BAJAS.- La disponibilidad del reforzamiento puede ser 
controlada mediante un temporizador de intervalo fijo y la propia conducta del sujeto. Por 
ejemplo, el temporizador puede hacer disponible el reforzamiento cada 20 segundos, pero 
únicamente en el caso de que el sujeto no haya respondido ninguna vez durante estos veinte 
segundos. Cada respuesta que el sujeto emita durante este intervalo restituye el temporizador a 
cero, de modo que vuelve a empezar la cuenta de 20 segundos; por el contrario, cada vez que el 
sujeto se mantiene sin responder durante 20 segundos, la respuesta siguiente a dicho intervalo sin 
respuestas obtendrá reforzamiento. Ya que este programa tiene el efecto de extinguir aquel las 
respuestas emitidas a una frecuencia superior a una cada 20 segundos, el programa se denomina 
reforzamiento diferencial de tasa bajas, abreviado DRL. Cuando la conducta del organismo cae 
bajo control de este programa, se caracteriza por su espaciamiento de respuestas, lo cual produce 
una tasa baja y estable. A esta conducta se le suele conocer como conducta de dilación, o bien 
respuesta retardada, ya que exige al sujeto que retrase su respuesta un período de tiempo 
determinado si es que aquélla ha de procurarle reforzamiento. 


RAZÓN FIJA.- Es posible hacer que la disponibilidad del reforzamiento dependa únicamente de 
determinadas propiedades de la conducta del sujeto. Un modo usual de lograrlo consiste en 
requerir al organismo que responda un número prefijado de veces por cada reforzamiento. Un 
animal puede, por ejemplo, obtener un gránulo de comida solamente después de haber apretado 
la palanca 50 veces, independientemente del tiempo que emplee en ello. Este programa de 


reforzamiento recibe el nombre de razón fija, ya que la razón de respuestas a reforzamientos es 
constante. El programa de razón fija es análogo al sistema de pago conocido con la expresión 
“a destajo”. 


La figura 19 muestra algunos ejemplos de la conducta que genera el programa de razón fija. 
Esta conducta exhibe, al igual que la producida por un programa de intervalo fijo, una pausa de 
postreforzamiento. No obstante, una vez que el sujeto ha empezado a responder, aparece 
inmediatamente una alta tasa de respuesta, cercana al máximo valor posible, que se mantiene 
hasta que se produce el reforzamiento. Este programa da lugar a una típica conducta de dos fases, 
con una tasa de respuesta nula inmediatamente después de cada reforzamiento, y una tasa de 
respuesta extremadamente alta en cualquier otro momento. La duración de la pausa 
postreforzamiento viene influida por factores tales como la razón de respuestas a reforzamientos 
requerida (mayores pausas cuanto mayor la razón); la magnitud del reforzamiento (pausas más 
cortas cuanto mayor el tamaño del gránulo); el nivel de deprivación (pausas más largas cuanto 
más saciado), etc. Cuando estos factores producen pausas extraordinariamente largas confiriendo 
a la gráfica una apariencia de estiramiento, a la conducta suele denominársela metafóricamente 
conducta distendida o de razón distendida. 


EVITACIÓN.- Tal como antes se ha indicado, la conducta de un organismo puede resultar reforzada 
no sólo mediante la obtención de comida, agua, etc., sino también por la prevención de estímulos 
nocivos tales como shocks eléctricos. Un procedimiento común para generar conducta de 
evitación consiste en administrar breves shocks al organismo a intervalos regulares —cada cinco 
segundos, por ejemplo— en tanto no apriete la palanca. Si el sujeto no responde, el intervalo entre 
shocks es de cinco segundos, denominándose a este período intervalo shock-shock. Apretando la 
palanca, el sujeto pospone el próximo shock por un período de tiempo dado, por ejemplo, 20 
segundos. Así, pues, una vez ha respondido, el próximo shock no llegará, por ejemplo, hasta al 
cabo de 20 segundos. Cada respuesta subsiguiente volverá a posponer el shock por 20 segundos. 
El intervalo durante el cual cada una de estas respuestas de evitación pospone el shock es el 
intervalo respuesta-shock. Este proceso da lugar a una tapa típicamente estable de la respuesta de 
apretar la palanca (véase la figura 35), quedando determinada dicha tasa por los intervalos 
respuesta-shock y shock-shock, entre otros factores. 


CONTROL POR ESTÍMULOS.- Un organismo, ya sea rata, mono o humano no responde de modo 
continuo en todas las formas posibles, independientemente de tiempo y lugar. En general, 
determinados tipos de conducta resultan apropiados a determinadas situaciones. Al decir 
apropiado, debe entenderse que el reforzamiento llegará solamente bajo ciertas condiciones; es 
precisamente bajo estas condiciones, y no otras, que la conducta aparece. Así, pues, el 
reforzamiento no aumenta meramente la probabilidad de la respuesta, sino que al mismo tiempo 
hace que aquella respuesta sea más probable al concurrir las mismas condiciones, u otras 
similares, que estuvieran presentes en reforzamientos previos. 


Una sencilla técnica experimental empleada para especificar al menos una de las condiciones bajo 
la cual una respuesta será reforzada, consiste en presentar al sujeto un determinado estímulo 


ambiental en las ocasiones en que el reforzamiento está a su disposición. Por ejemplo, un mono 
puede procurarse comida apretando una palanca mientras está sonando un timbre de un 
determinado tono; por el contrario, en ausencia del timbre, esta misma respuesta es extinguida. 
Debido a que el animal no es nunca reforzado cuando no suena el timbre, solamente apretará la 
palanca cuando aquél suene. Se dice entonces que el sujeto discrimina el sonido del timbre y el 
procedimiento empleado para conseguirlo recibe el nombre de discriminación de estímulos. 
Dado que a veces el término “discriminación” se ha utilizado frecuentemente en descripciones 
poco rigurosas al margen de su definición operacional, muchos investigadores prefieren no usarlo 
en absoluto, y emplear en su lugar control por estímulos. Así, pues, la respuesta de apretar la 
palanca ha caído bajo el control del sonido del timbre, como sugiere el hecho de que el organismo 
emita dicha respuesta en presencia del timbre solamente. 


PROGRAMAS MÚLTIPLES.- Un estímulo ambiental puede controlar no sólo la emisión o no emisión 
de una respuesta dada, sino también características específicas de la conducta reforzada en su 
presencia. Puede “indicar” al organismo, por ejemplo, la presencia de otras variables que entran 
en juego en una situación determinada. Así, la conducta de una paloma consistente en picar sobre 
un disco iluminado, será reforzada según un programa de intervalo fijo de 5 minutos cuando el 
disco esté rojo; cuando la luz del disco cambie a verde, entrará en vigor un programa de 
reforzamiento de razón fija que requiera a la paloma cien respuestas por cada reforzamiento 
recibido. Al cabo de cierto tiempo, en presencia del disco rojo, la conducta de la paloma mostrará 
las propiedades típicas de un programa de intervalo fijo; en presencia del disco verde, aparecerán 
las pausas cíclicas y la alta tasa de respuesta características del programa de razón fija. 
El investigador alude a esta diferenciación de actuaciones en presencia de los dos estímulos 
diciendo que los programas de reforzamiento han caído bajo el control de estímulos, lo cual 
significa simplemente que en presencia de cada estímulo el sujeto se comporta del modo 
apropiado al programa de reforzamiento en vigor. Al combinar más de un programa y también 
más de un estímulo, este procedimiento experimental recibe el nombre de programa de 
reforzamiento múltiple. 


ENCADENAMIENTO.- Hasta aquí, solamente he usado como ejemplos de reforzamiento 
necesidades biológicas tales como alimento y evitación del dolor. Sin embargo, también han 
resultado de utilidad en el laboratorio otros muchos tipos de reforzador, algunos de los cuales 
parecen constituir, al igual que el alimento y la evitación del shock eléctrico, reforzadores 
naturales. Así, la conducta de un niño pequeño puede reforzarse con luces que se encienden y se 
apagan, dentro de una rueda de alambre, y la de un mono, poniendo a su alcance ciertos objetos 
móviles para que pueda manipularlos. Aquellos reforzadores que parecen ser reforzantes por sí 
mismos y que no requieren ningún procedimiento especial para convertirse en tales, se 
denominan reforzadores primarios, y su efecto sobre la conducta, reforzamiento primario. 


Incluso la observación más superficial revela que muchos, por no decir casi todos los 
reforzamientos que actúan sobre la conducta humana, son de especie distinta a los 
reforzamientos primarios. El dinero, por ejemplo, no es un reforzador primario. Los signos de 
prestigio, de posición social, la evitación de la desaprobación familiar, son todos ellos tipos 


distintos de reforzamiento, aunque no hay nada inherentemente reforzante a ellos. Recurrimos a 
técnicas especiales para conferir funciones reforzantes a estímulos que no resultaban serlo en 
principio: de ahí que reciban el nombre de reforzadores condicionados o también reforzadores 
secundarios. 


Para ilustrar el procedimiento experimental básico mediante el cual se establece un reforzador 
condicionado a partir de un estímulo neutro, efectuaremos una pequeña modificación en un 
programa múltiple. Mientras está encendida una luz roja, un mono puede procurarse un gránulo 
de comida apretando una palanca 50 veces, es decir, el mono está bajo un programa de 
reforzamiento de razón fija de 50. Tan pronto el animal ha recibido el gránulo, el color de la luz 
cambia a verde, y no volverá a cambiar a rojo hasta que hayan transcurrido cinco minutos y el 
mono apriete la palanca de nuevo. Mientras la luz está verde, por lo tanto, rige un programa de 
intervalo fijo de cinco minutos, pero el reforzamiento final a este intervalo no es un gránulo de 
comida, sino simplemente el cambio de color de la luz de verde a rojo. Los gránulos están a 
disposición del animal únicamente cuando la luz está roja, pero ésta sólo puede ser cambiada a 
dicho color en virtud de la propia conducta del sujeto. 


Podemos resumir y ordenar la secuencia de este modo: luz verde en intervalo fijo de cinco 
minutos, pasados los cuales la primera vez que la palanca sea apretada cambiará el color de la luz 
a rojo; mientras esté encendida la luz roja, 50 respuestas a la palanca consecutivas harán caer un 
gránulo de comida; al caer el gránulo, la luz cambiará a verde de nuevo, y se repetirá el ciclo. 


A pesar de que no hay reforzamiento en forma de comida en presencia de la luz verde, el animal 
emite bajo esta luz la típica conducta controlada por un programa de intervalo fijo con 
reforzamiento comestible, lo cual indica que la luz roja es lo suficientemente reforzante como para 
generar y mantener la conducta de intervalo fijo. La luz roja ha adquirido, pues, poder reforzante, 
o sea, que se ha convertido en un reforzado condicionado, debido a que el animal obtiene comida 
únicamente en su presencia. 


Dado que la luz roja y su programa asociado de reforzamiento con comida pueden aparecer 
solamente en virtud de la conducta del sujeto, este procedimiento experimental recibe de 
encadenamiento. El programa de razón fija en presencia de la luz roja se halla encadenado al 
programa de intervalo fijo en presencia de la luz verde, actuando como nexo de unión la respuesta 
de apretar la palanca por parte del sujeto. Esta cadena en particular recibe está compuesta de dos 
miembros, lo cual no implica que toda cadena deba limitarse a este número de componentes. 
La luz roja actúa como reforzador condicionado, que incide al completarse el primer miembro de 
la cadena, es decir, la conducta de intervalo fijo bajo control de la luz verde. El gránulo de comida 
que refuerza el segundo y último miembro de la cadena se denomina reforzamiento terminal. 
En el ejemplo aquí tratado, un reforzamiento primario resulta ser, además, el reforzamiento 
terminal, aunque podría haber sido, a su vez, un reforzamiento condicionado. 


Debido a que el poder reforzante de un reforzador condicionado e deriva de su asociación con 
otro reforzador, ya sea primario o condicionado, es posible que aquél resulte mucho más 
poderoso que cualquier reforzador primario al poderse asociar con una gran variedad de 


reforzadores, tanto primarios como condicionados. En el ejemplo anterior de encadenamiento el 
reforzamiento terminal puede variarse de modo que el sujeto que reciba comida en presencia de 
la luz roja cuando tenga hambre, agua cuando tenga sed, acceso a un miembro del sexo opuesto 
cuando esté sexualmente excitado, pasara una área de actividad y juego después de un período de 
reclusión o también que pueda, al sonar un timbre, evitar un shock subsiguiente. Esta lista puede 
alargarse indefinidamente, con lo cual la luz roja quedará de este modo asociada con una gran 
variedad de reforzadores, y ella, a su vez, funcionará como reforzador condicionado en una amplia 
gama de situaciones. Podemos decir, pues, que la luz roja se habrá convertido en un reforzador 
generalizado. Un claro ejemplo de reforzador generalizado lo constituye el dinero. 


ALGUNOS CONCEPTOS GENERALES 


Las situaciones experimentales que he citado como ejemplos comparten todas ellas al menos una 
característica importante: el organismo experimental es libre de responder en cualquier 
momento. En ningún caso se constriñe la actuación del animal, forzándolo o presentándole 
impedimentos de ningún tipo; así, por ejemplo, nunca se retira la palanca del espacio 
experimental con el fin de impedir que el sujeto responda en momentos inconvenientes a la teoría 
del experimentador. Las únicas restricciones que operan sobre la conducta que registramos son 
aquellas inherentes a las propias leyes conductuales. Esta situación general se designa con el 
término situación de respuesta libre. 


Aquellos experimentadores que usan la situación de respuestas libre, juntamente con el grafico 
continuo de la actuación del organismo obtenido en el registro acumulativo, muestran su interés 
por la conducta como proceso que tiene lugar en el tiempo de un modo continuado. 
Esta concepción de la conducta como proceso temporal da lugar al término conducta en curso, 
que expresa la continuidad de respuestas del sujeto, aunque las respuestas individuales puedan 
ser discretas y bien definidas. Si para un organismo en situación de respuesta libre el 
reforzamiento es la evitación de un shock, las variables relevantes que operan en esta situación 
generarán conducta de evitación en curso de un nivel determinado. Otras variables darán lugar a 
conducta en curso reforzada con comida, etcétera. 


La conducta en curso ofrece al investigador una importante ventaja táctica, que reside en el hecho 
de que dicha conducta puede ser directamente manipulada. El investigador puede, por ejemplo, 
introducir una nueva variable, o bien cambiar el valor de una variable que ya sea relevante, y 
observar las variaciones que muestre la conducta en curso del sujeto dicha conducta en curso 
puede servir como línea de base a partir de la cual medir los efectos de las operaciones 
experimentales. Una línea de base conductual no es un estado idealizado de conducta, inferido de 
la actuación de un grupo de individuos mediante un proceso estadístico de promediación, sino al 
actuación continuada de un único individuo. 


Una vez ha sido establecido un nivel aceptable de conducta de línea de base, el investigador puede 
disponerse a cambiar las condiciones experimentales. Si la conducta de línea de base es 
mantenida por un programa de reforzamiento de intervalo fijo, se puede, por ejemplo, alterar la 
longitud del intervalo, o bien cambiar el tamaño del gránulo de comida. Uno de los distintos tipos 


de línea de base más útiles para medir los efectos de las operaciones experimentales lo constituye 
la conducta que es mantenida en estado estable, es decir, la conducta cuyas características no 
cambian durante largos períodos de tiempo, permaneciendo, por lo tanto, estable. Así, por 
ejemplo, el programa de evitación descrito arriba mantiene la tasa de respuesta del sujeto en un 
valor constante a lo largo de muchas horas e incluso días. Todo cambio que se observe en una 
conducta de estado estable puede atribuirse con seguridad a las manipulaciones del 
experimentador. 


La conducta de estado estable resulta todavía más útil al experimentador si es reversible. Una vez 
que se han cambiado las condiciones experimentales, y por lo tanto se ha alterado la conducta, 
¿se puede esperar que al volver a las condiciones originales la conducta vuelva también a su 
estado estable inicial? Si la conducta origina puede recuperarse, decimos que es reversible. 
Gracias al fenómeno de la reversibilidad resulta posible replicar un experimento muchas veces en 
un único organismo y elimina el incómodo, aunque interesante problema, de tomar en 
consideración la historia conductual del sujeto. Cuando la conducta es irreversible, o sea, 
imposible de retornar a su estado original, el investigador debe considerar las variables a las cuales 
el sujeto estuvo expuesto en el pasado y que, aunque no se hallen presentes en el momento de 
llevar a cabo el experimento, constituyen la historia conductual del organismo. 
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